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尼尔 • J * 萨尔金德 （ NeilJ . Salkind ) 他在堪萨斯大学心理学和教育学系从教 
30年，同时兼任人类发展和家庭生活系的教授,30年来，开设的课程有发展理论、生命 
全程发展理论、统计学和研究方法。他获得马里兰大学人类发展的博士学位，发衷了 
80多篇专业文章，也是一些大学教材的作者，如《儿童发展、探索性研究和人类发展理 
论导论》 (Sage ， 2004)。他也是1989 — 2002年的《儿童发展摘要和书 0 》的编辑。他 
儿童发展研究领域很活跃，在贸易领域也有很多著述。他住在堪萨斯州劳伦斯市一 
所需要经常维护的老房子里，喜欢烹饪、游泳、阅读、藏书及收藏古典沃尔夫 P 1800。 




给学生的话： 
我为什么写这本书 



我很幸运，三十年来能够在堪萨斯大学给成千 I :万的学生讲授基础统计学。他们 
中的大多数（至少在这门课开始时）都相当的焦虑，焦虑的原因通常是他们从其他学 

生那里听来的经验之谈。 一 般来说，他们听到的一小部分是」 i : 确的-学习统计学要 

投人很多的时间和精力（而且偶尔还会遇到“怪物型"老师）。但是他们听到的大部 
分——统计学特别难学，令人困扰——足不 ll : 确的，这恰恰是他们产生焦虑的原因。 
而实际上许多被吓倒的学生都通过了他们以为不能通过的课程。只要集中精力，按部 
就班，将基本原理应用于真实的生活来理解，他们都能通过这门课程，甚至能够在这个 
过程中得到乐趣。这就是我在写《爱 t 统计学》第1版的时候想尽力做到的，在这一 
版的修订中我更加努力做到这一点。 

在经过不断地摸索以及少敏成功大 m 失败的尝试之后，我已经学会 r 以某种方式 
教授统计学，我和我的许多学生认为这种方式不会让人感到害怕，同时能够传递大 m 

的信息。 

通过这本书可以了解基础统计学的范围并学习所有应该掌握的信息，也可以了解 
整理和分析数据的基本思路和最常用的技术。本书理论部分有一些，但是很少，数学 
证明或特定数学程式的合理性讨论也很少。 

为仆么《爱上统汁学》这本书不增加更多理论内容？很简单，初学者不需要。这 
并不是我认为理论不重要，而是在学习的这个阶段，我想提供的是我认为通过一定程 
度的努力可以理解和掌握的资料，同时又不会让你感到害怕而放弃将来选修更多的课 

程。我和其他老师都希望你能成功。 

因此，如果你想详细了解方差分析中 F 值的含义，可以从 Sage 出版社查找其他的 
好书（我愿意向你推荐书目）。但是如果你想了解统计学为什么以及如何为你所用， 
这本书很合适。这本书能帮助你理解在专业文章中看到的资料，解释许多统计分析结 

果的意义，并且能教你运用基本的统计过程。 

祝大家好运，希望你们能让我知道如何修订这本书才能更好地满足初学统计学的 

学生的需求。 

致谢 

一本好书是好的编辑和作者共同努力的结果。如果这本书真的实现了最初的设 
想，也是巾于 C • 德博拉_劳顿 （ C . Deborah laughion ) 的指导、建议、努力工作和大力 

支持，并且使得这本书最终能够成书 p 在德 博拉* 劳顿离开 Sage 之后，爱 丽森， 马蒂 
特 （ Alison Mudditt ) 与利萨_奎瓦斯-肖 （Lisa Cuevas-Shaw ) 承担了编辑的责任，而且他 
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们总是在需要的时候给予帮助。帕姆 • 格林 （Pam Ggreeii ) 阅读了 本书的 初稿，而且帮 
我找出疏漏之处，尽管我确信那不是全部，但是他的工作对本书质量的提髙是极大的 
帮助。同时感谢文字加工编辑里安*列赫 （fiann Lech ) 、制作编辑戴安娜 • 阿克塞尔 
森 （ Diana Axeben ) 、内页设计和排版员提姆 • 吉森 （Tim Giesen ) 、艺术制作桑德拉 • 
额 * 索瓦约特 （Sandra Ng Sauvajot 〉 、卡通设计 贾森* 洛夫 （Jason Love ) 以及封面设计 
米歇尔 * 李 • 肯尼 （Michelle Lee Kenny ) 0 

最后，与通常一样感谢一位具有非凡魅力的女性-—莱尼 ( Leni ) 0 

现在，关于第2版…… 


以上的内容说明了我写这本书的最初想法，但是关于新的版本介绍很少。 

任何一本书都需要不断修订，《爱上统计学》也不例外。过去的三年许多人曾告 
诉我这本书是多么的有帮助，但是其他人也告诉我他们多么想让这本书做出修订以及 
为什么。在修订的过程中我尽力满足这两方面人的需求。书中部分内容仍保留，部分 


做出了修订。 

总是有新的事物值得关注，同时也需要用不同的方式重新理解老的主题和观念。 
以下的清单是《爱上统计学》中新的内容。 

•第9章新增了效果值的简要介绍，这部分在第一版编辑过程中被删减了。新增 
的目的是让学生对差异的重要性有更深人的认识。 

• 你会发现新增了第12章——因方差分析。虽然第一版的一维分析对一些人 
已经足够，但是新增的这一章可进一步满足其他人更多的需要。 


• 研究设计和统计分析中总是要考虑测蛩结果的工具和有效性检验。考虑到这一 
点，第16章增加了信度和效度的重要形式和相关问题的简要综述。 

• 每一章后都增加了更多的练习题，许多习题可以用到本书附录 C 的数据、教师 

资源光盘的数据或 http :// www . soe . ku * edu / facuUy / salkirKl / slals _ ffiwh 、/ 的在线 

数据。在线数据可以依据需要下载 a 

• 现在的数据库一般有两种形式—— SPSS (流行的统计分析软件）和 Excd (许多 


人使用电子表格分析数据 K 

•第1版中出现的所有错误都是我的责任，我向被这些错误困扰的老师和学生道 
歉。我非常感谢所有那些指正错误并使得第2版更好的信件、电话和电子邮 
件。在这一版，我们每个人都尽力修改错误，并希望工作做得更好。期望能收 
到大家的建议、批评和意见。祝大家好运。 


尼尔 • j * 萨尔金德 
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万卷方诔 


爱上统计学 


这有什么好欢呼的，你会这样说吗？现在给我几分钟的时间向你展示一些 
非常成功的科学家如何使用被广泛使用的叫做统计学的工具。 

•米 歇尔， 兰普尔 （Michelle Lampl ) 是艾莫里大学的儿科专家和人类学家。她和 
朋友喝咖啡的时候，朋友谈到她的孩子长得多么多么的快。实际上，这个初为 
人母的朋友几乎是说她的儿子”像野草一样疯长”。兰普尔博士十分的好奇 
(像所有的科学家对事物感到好奇一样），她想她应该实际测量这个孩子以及 
其他孩子在婴儿期的生长速度。她着手测量 一群孩 子每天的生长，让她非常 
吃惊的是她发现一些婴儿差不多一个晚上就长一英寸！确实是爆发式生长。 

想知道更多吗？请阅读 原著： 你可以从兰普尔、费尔德伊斯和约翰森 （ Lamp ， 
M . , Veldhuis , J . D . , and Johnson , M . L . ) {1992) 发表在《科学》 258 期 801 ~ 803页 

上的文章“突变和停滞：人类生长模式 （ Saltation and stasis : A Model of human 
growths ) M 中了 解'聚.多。 

1 

•休*肯珀心^^)是堪萨斯大学心理学教授，曾经研究许多非常有趣的项 
目。她和其他的研究者正在研究修女群体，分析他们的早期经验、活动、人格 
特征和其他信息与他们中年以后的健康状况之间的关系。最特别的是这个由 
不同科学家组成的小组（包括心理学家、语言学家和神经学家，等等）想知道所 
有信息多大程度上可以预测老年痴呆病的发生。她发现修女在20多岁时写 
作的复杂性和他们在50、60年或者70年后患上老年痴呆病的可能性有关。 

想知道更多吗？请阅读原著：你可以从斯诺顿、肯珀、莫蒂默、格雷纳、韦斯 
坦因和马克斯贝里 （ Snowdon ， D . A , , Kemper , S . J . , Mortimer , J . A . , Greiner , L . H ., 

Wekstein , D . A . , and Markesbery , W . R . ) { 1996 ) 发表在 < 美国医学协会杂志 >275 

期528 ~532页上的文章早期生活的语言能力和认知功能与晚期生活的老年痴 

呆症：修女研究的发现 （ Linguistic ability in early life arid cognitive function and 
Alzheimer 1 s disease in late life : Findings from the nun study. ) ■’中解更多。 

• 阿莱莎 • 休斯顿 （Alelha Huston ) 是德州大学奥斯订分校的研究者和教师，投入 
大量的研究来发现看电视对幼儿心理发展的作用。其中之一的工作是她和她 
后来的丈夫约翰 • 赖特 （ John . C . Wright H 周查入学前观看一定量的电视教育节 
目对入学后学习的影响。他们发现了确实的证据可证明观看教育节目如 《罗 
杰斯 先生》 或 《芝麻街》 的儿童比没有看的儿童在学校表现得更好。 

想知道更多吗？请读原 著：你 可以从柯林斯、赖特、安德森、休斯顿、施密特 
和麦凯尔伊 （ Collins ， P . A . , Wright , J . C . , Anderson , D . R . , Huston , A . C , , Schmitt 9 

K - and McEiroy , E . ){ 1997 ) 提交于在美国阿尔伯克基举行的儿童发展研究协会 

年会的论文"幼儿时期媒体教育对青少年学习成绩的影响（邱 krb of early child- 
hood media use on adolescent aehivement^ )" 中了 解更多。 

所有的研究者都有一个特别的问题，他们对这个问题有兴趣并用他们的直 
觉、好奇心和学术训练来回答这个问题。作为调查的一部分，他们使用我们称作 
统计学的工具分析所收集到的所有资料的意义。如果没有这些工具，所有的资 
料就是不相关的资料的汇集。那么这些资料就不能在兰普尔的研究中用于得出 
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儿童生长的结论，不能在肯珀的研究中用于对老年痴呆病有更好的理解，也不能 
4休斯顿和赖特的研究中用于更好地理解看电视对幼儿学习和社会发展的 

影响 D 

统计学——^整理和分析资料并使得资料更容易理解的科学-—使得研究任 
务可行。 

通过这样的研究所得出的任何结论都是有用的，原因是我们使用统计学使 
得这些结果有意义。这也正是本书的目标——让你理解这些基本的工具以及这 
些工具的用途，当然也包括如何使用这些工具。 

在《爱上统 计学》 的第 I 部分介绍统计学学习的内容，以及为什么值得花费 
精力来掌握这个领域关键的基本术语和思路。这都是学习本书其他.部分的 

准备。 



统计学还是虐待学？ III 你决定 



• 统计学的学习内容 


• 为什么学习统计学 
• 如何通过这门课程的考试 


为什么学习统计学 

你以前肯定听到过“统计学很难学”，“统计中相关的数学部分很难 
应付”，“我不知道怎么用电脑”，“学统计学有什么用”，“接下来做什么”， 
还有就是统计学导论课上学生的著名呐喊，“我就是不懂 r 

好啦，放松些。学习统计学导论的学生总会发现他们自己时不时有以 
上的想法，如果他们不和其他学生或者他们的爱人、同事或者朋友交流的 
话，他们至少有上面的一个想法。 

而且，不是开玩笑，一些统计学课程很容易被描述为虐待学。这是由 
于那些书无一例外地让人厌烦，而且作者没有想象力。 

本书将改变这种状况。事实是，你或者你的老师选择了《爱上统 u 
学》，这表明你准备选择正确的方法——不会让人害怕、信息充分并很 
实用 （ 甚至 有趣) 的方法，而且尽可能地教你应用这一有价值的工具—— 
统计学的确是有价值的工具，需要知道些什么。 

如果选用这本书作为教材，这也意味着你的老师明显地站在你的立场 
上——他或她知道统计学是让人害怕的，但他们已经采取措施来确保统计 
学不会让你害怕。事实上，我敢打赌你在几个星期之后享受这门课程的机 
会很大（这同样也难以让人相信）。 

统计学简史 

在阅读更多内容之前，有必要从历史的视角了解统计学。你知道，毕 
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竟几乎所有的社会科学、行为科学、生物学的大学生和教育学、护理学、心 
理学、社会福利和社会服务以及人类学的研究生都需要选修 这门课 。了解 
统计学应用领域从何处斤始是否有必要？回答是当然有必要。 

只要冋顾过去，人们就会发现计数是个非常好的创意（就彳 1 r ‘ 你需要 
多少这个来交换那些中的一个”），同样收集信息也成为有用的技能。如 
果用到计数，人们就会知道太阳在一季升起多少次,度过整个冬天需要多 

少食物，以及一个人拥有多少资源。 

这只是开始。 一 旦数字成为语言的组成部分，似乎接下来的步骤就是 
将数字和结果结合在一起。在17世纪早期就开始收集与人口相关的数 
据。以此为基础，科学家（大多数是数学家，此外是物理学家和生物 学家) 
需要发展特定的工具来回答特定的问题。例如，弗兰茨 • 加尔东 （Francis 
Galton ) (顺便说一下，他是达尔文的表兄弟，生卒年代是1822 一 1911年）， 
他对人类智力的性质非常感兴趣。为回答家庭成员智力一致性的基本问 

题，他使用了特定的统计工具-相关系数 （ 首先是数学家发展的），接着 

他把相关系数广泛地应用于行为科学和社会科学。你会在第五章对这个 

工具有全面的了解。 

实际上，你将学到的大多数基本统计过程最初应用于农业、天文学甚 
至政治学 领域。 在人类行为领域的应用则比较晚。 

在过去的100年中，在发明新方法应用旧观念方面取得丫极大的进 
步。最简单的用于比较两个群体的均值差异的检验方法在20世纪初取得 
首次进展。在此基础 h 建立的技术十年之后才提出，而 a ■得到了极大的完 
善。随着个人电脑和类似 SPSS 的软件（见附录 A >的应用，任何人想研究 

这些有意义问题都可以使用复杂的统计技术。 

影响力深远的个人电脑的应用有利有弊。有利的方面是大多数统计 
分析不再需要使用巨大、昂贵的中央处理机。而价值不超过丨000美元的 
人电脑就能满足95 %的人95%的需求。另一方面，很少有大学生（如已 
经通过这门课的你的同学）会使用他们已有的旧数据，并且认为应用复杂 

的 SPSS 软件分析这些数据可以得到可靠、可信和有意义的结果-这是 

不正确的。你的老师可能会说“垃圾进，垃圾出”——如果你开始就没有 
使用可靠、可信的数据，那么分析这样的数据所得到的结果就既不可信也 

不可靠。 

现在，不同领域——从司法、地球物理学到心理学——的统计分析人 
员发现他们基本上使用相同的技术来回答不同的问题。当然在资料收集 
方面有重要的差别，但是大体上来说，随着数据（大量的数据）收集所进行 
的分析（多个的分析），即使说有所谓的差别也是非常类似的。那么伦理 
问题呢？这个课 I :会给你提供一定的工具来理解统计学如何应用于几乎 
任何一个学科中，帮你轻松搞定那些3 ~4个学分的课程。 

如果你想更多地了解统计学历史，而 IL 想按历史发展来了解，可以从 
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爱上统计学 


一个很好的地方开始，就是圣安赛姆学院的网络，网址是 http：//w ww : an 
selm . edu / hompage / jpitocch / biostatshist . html ; 或者 http :// www . stat . ucla . 
edu / history / (加利福尼亚大学洛杉矶分校）。 

统 计学： 是什么（或不是什么） 


《爱上统计学》是一 本关于 基础统计学，以及在不同的情况下如何应 
用统计学分析和理解资料的书。 

就一般意义而言，统计学是描述一系列可用于描述、整理和解释资料 
或数据的统计工具和技术。迭些数据可能是特定数学课程的学生的考试 
得分、解决问题的速度、吃某种药感到不适的病人人数 、世界 系列大赛每— 
局出错的次数或者圣达菲高级餐 K 晚餐的平均价格。 

在所有的案例或者我们可以想到的更多的案例中，都需要收集、整理、 
汇总和解释数据。在本书的描述性统计部分你可以学到收集、整理和汇总 
数据。而在了解了推论性统计的用途之后就可以学会解释数据。 

什么是描迷坑讨 

描述统计（ descriptive statistics ) 常用于整理、描述所收集数据的特征。 
所收集的资料有时也称作数据集 （ data set ) 或者就叫数据 （ data ) 。 

例如，下面所列出的就是22名大学生的姓名、主修专业和年龄。如果 
需要描述大学最流行的专业是什么，你可以使用描述统计来概括他们的选 
择（也称作众数）。在这个例子中最大众化的专业是心理学。如果你想知 
道学生的平均年龄，可以很容易的计算另一个描述统计值（也叫做 均值） 
来确定这个变量。这两个简单的描述统计值常用于描述数据。就如我们 

对下面 个案例的分析一样，描述统计使我们能很好地描述大的数据集 
的特征。 


姓名 


专业 


年龄 


姓名 


专业 


年龄 


学学学学学学学学 学 
育理育理育 fr - 理理学理史 
教心教心教教心心§护历 


你瞧，这是多么简单！要确定最常被选择的专业，就是要确定哪一个 
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专业出现次数最多。要确定平均年龄，就是将所有的年龄值加起来然后除 
以22。你是对的一出现次数最多的专业坫心理学 （9 次），平均年龄是 
20.3。瞧，没人插手一你就是统计分析师。 

什么 是推办 晚讨 

推论统计 （inferential statistics ) 通常是 （ 但并非总是〉数据收集和汇总 
后的下一步。推论统计常利用较小群体的数据（如我们的22个学也构成 
的群体）来推论可能的较大群体（如艺术和科学院的所有学生）的特征。 
这个较小的群体通常叫做样本 （sample ) ，是总体 （population ) 的一部 

分或一个子集。例如，新泽西州纽瓦克的所有 h 年级学生构成一个总体 
(所有具备这些特征—— II :好是五年级而且住在纽瓦克——的人都包括 
在内〉 ，从中选取150人就构成一个样本。 

咱们来看另外一个例子。作为新雇用的研究人员，你的市场代理要你 
确定多个名称中的哪一个最适合作薯片的新品牌，是薯片王，乐趣薯片，还 
是嚼嚼乐？作为专业统计分析人员 （ 我知道我们现在超前了一点，但是保 
持信念），你需要选取一个薯片食用者小群体，这个群体可以代表所有的 
肓欢吃紫片的人，接着询问这个群体让他们告诉你最喜欢这三个名称中的 
哪一个。如果你做得很好，就可以很容易地将这个发现推论到更大的薯片 
食用者群体中。 

或者，如果说你对某种疾病的最佳治疗方案感兴趣。你可以让一组试 
用一种新药，另一组食用安慰剂（或者大家知道的没有任何效果的其他丸 
剂），第三组什么药也不吃，然后来看结果是什么。好吧，你会发现大多数 
病人在没有接受仟何治疗情况下会好转，而且机体自身会恢复！药物没有 
任何效果 o 那么依据你的实验结果，你可以将这些信息推论到更大的遭受 
这种疾病痛苦的病人群体。 

换 句话说 - - 

统计学是帮助我们理解周围世界的工具。这是通过整理我们收集到 
的数据实现的，而且接着还可以让我们做出特定的推断，也就是怎样将那 
些数据的特征应用到新的情况。描述统计和推论统计可以一起发挥作用， 
使用哪一种、何时使用取决于你想要回答的问题。 

我在统计学课堂上做什么 

你选择使用这本书可能有多种原因。也许是选修了统计学导论课程, 
或者是在申请综合考试，甚至是在暑假预习这本书 （ 恐怖！ ） ，并 a 想申请 
更髙级的课程。 

总之你都是学习统计学的学生，不论你是否参加课程结朿后的考试， 
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或者只是为了自己的目的选择这门课程。但是学习这门课有许多好的理 
由——它很有趣，它很重要，或者同时具备两者。 K 面是我的学生在我们 
的统计学导论课程开始之初听到的一些说法。 

1 . 统计学 I 0 i 或统计学1或者是你们学校用的任何其他课程名称，在你 
的成绩单中看起来很重要。说真的 _ 统计学是你完成你的专业的必修课程^ 
即使不是，拥有统计学技能绝对是到时候找工作或进一步学习的重要附加 
值。而 ii 如果选修了更高级的课程，你的简历肯定会更令人印象深刻。 

2. 如果不是必修课程，选修基础统计学可以把你和没有选修的同学区 
別开来。这表明你愿意选择难度和投入程度在平均水平以上的课程。 

3. 基础统 it 学可能是你不熟悉的一种智力挑战。这个过程需要考虑很 
多事情 ，一 些数学计算，一些想法和应用的结合。最起码，把所有活动加起 
来看就是一次充满活力的智力体验，因为你要学习的是全新的领域和学科。 

- 4. 毫无疑问，如果具备一定的统计学背景，你会成为社会科学或行为 

科学的更好的学生，因为你吋以更好地理解杂志中的文章， tli 可以更好地 
理解老师和同伴在课堂内或课堂外讨论的内容或所做的研究。你可能很 
惊冴你第一次对岛己说 r 哇，我真的听懂了他们在讨论什么”。而且这会 

经常发也，因为你已经具备了十:确地理解科学家如何得出结论所必备的基 
本工具。 

5. 如果你计划获得教育学、人类学、经济学、护理学、社会学或其他社 

会、行为或生物科学领域的任何一个学科的硕士学位，统计学课程是你前 
进的基础。 \ 

6 - 最后 * 你可以夸口说你完成人人都认为是相当于建立和运行核反 
应堆的高难度课程。 

使用这本书的十种方式（同时也在学统计学！） 

耶，刚好是需要的统计学书。但是这一本是不同的 ^ 这本书是针对学 
生写的，但不是降低标准，而是信息充分，也尽可能展现基础内容。本书也 

没有假定在课程开始之前应该具备什么知识，只是进程安排较缓、步骤较 
小，可以让学生按自己的节奏安排。 

大家都认为统计学是很难掌握的 课程。 的确我们也这么认为，因为统 
计学的一部分的确充满挑战。另一方面，无数的学生已经掌握了这门课程， 
你也可以。在开始我们的第一个主题之前，先看一下导论这一章的要点。 

1. 你不笨。这是真的。如果你是笨蛋，你不可能在学业方面走这么 
远。因此，对待统计学就像对待其他新的课程那样吧。听讲座，学习基本 
内容，做书上的练习或课堂练习，那么你就会学得很好。火箭研究者精通 
统计学，不过你不需要像火箭研究者那样研究统计学。 

2 . 你怎么知道统计学很难学？统计学很难学？既是也不是。如果你 
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是从上过这门课的朋友那儿听来的，而他们没有努力学习也没有学好，那 
么崗定愿意告诉你统计学是多么难学，甚至会说，统计学即使不是对整个 
生活的灾难，对整个学期来说也是灾难。不过我们不要忘记一我们总是 
倾听抱怨者的抱怨。因此，我们建议你应该以这种态度开始这门课程，也 
就是，等着看统计学是否难学，并且依据自己的经验做出判断。更好的选 
择是找几个上过这门课的人讨论一下，获得他们的总的看法。不要依据让 
人泄气的人的经验做出判断。 

3•不要逃课——按顺序学习各章的内容。《爱上统计学》的每一章都 
是下一章的基础。我希望祚课堂 h 学习了所有内容后，你就可以回顾整本 
书，并把这本书作为参考书。如果你需要确定表中的特定值，可以查阅附 
录 B 。 或者，你需要 id 起如何计算标准差，町以回顾第三章的内容。但是 
现在要按照木书的顺序学习每一章。当然也可以不按照顺序，先了解后面 
的学习内容。但是在学习后面章节之前要掌握前面的章节。 

4. 形成学习小组。这是确保通过这门课程的最基本的方式之一。在 
一个学期的开始，要和朋友商定一起学习。如果没有朋友选择同一课程， 
那么就要结交新朋友，或者邀请和你一样看起来很髙兴学习统计学的学生 
一起学 M 。如果你学得比他人好，一起学习可以帮助他人，反之，他人学得 
比你好你就可以从他人那里受益。每个星期安排特定的时间聚在一起一 
个小时，复习每一章后的练习题，或者相互提问。或者依据需要安排更多 
时间。与他人一起学习是帮助你理解和掌握课程内容的有用的方式。 

5. 向老师提问或者向朋友提问。如果你不了解课堂上所讲授的内容， 

可以向老师提问辨明问题。毫无疑问-如果你不理解课程内容，那么这 

很可能是很多人共同的问题。老师一般都欢迎提问。特别是如果你上课 
前已经预习，你的问题就包含更多信息，可以帮助其他学生更好地理解课 
程内容。 

6. 完成章后练习题。练习题是以每一章的内容和案例为基础的。这 
些练习题可以帮助你运用每一章讲授的概念，同时可以建立自信心。这些 
练习题如何发挥作用？如何解答每一个练习题对应着的那一个问题。如 
果可以解答章后的练习题，那么你已经很好地掌握了这一章的内容^ 

7. 练习，练习，再练习。是的，这是个很古老的笑话。 

问： 如何才能到卡内基大厅^ ? 

答：练习，练习，再练习。 

好吧，这和基础统计学没有区别。你必须应用学到的知识，而且通过 
经常应用来掌握不同的方法和技术。这意味着解答1〜16章的练习题、好 
好利用遇到的任何机会帮助理解学到的内容。 

8. 寻找应用实例使得所学内容更现实。在其他课 h , 你可能有机会读 

* 美国存名的皆乐演奏厅，只有达到相当高演奏水平的咅乐人 I :才有资格在那甩登台。这里的问句本来是 
问路，——译者注 
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到杂志上发表的文章，讨讼研究的结论，并且对你的学习领域的科学研究 
方法的重要性进行一般的讨论。这呰都是机会，可以考察所学的统计学如 
.何帮助你更好地理解课堂讨论的主题和应用统计学的领域。这个想法实 
践得越多，你的理解就越好、越充分。 

9.浏览。首先阅读指定的章节，然后返回来带着目的阅读。要选择轻 
松地学习《爱上统计学》的道路，然后考察每一章包含的内容。不要逼迫 
自己。了解将要学习的主题的同时熟悉现在的课堂内容总会有好处。 

ia 得到乐趣。这听起来好像很奇怪。但是总的来说，与其让这门课 
和它的要求掌握你不如你掌握这门课。建立学习计划并 按计划 完成,在课 
堂上提问题，而且将智力实践看作是成长的一种形式。掌握新知识总是令 
人激动和满足——这是人类活力的体现。在这里你也可以体验这种满足 
感——集中精力、做出必要的保持功课水平的承诺并且努力学习。 

关于那些符号 

一个符号是一种象征。浏览《爱1:统计学》全书你会发现有许 
多不同的符号。下面是每一个符号以及所代表的意义。 

这个符号表示11 •: 文之外的信息。我们发现有必要详细说明特 
定的观点，而且我们能够很容易地 C 常规资料之外做到这一点。 

我们可以选择一些更专业的观点，然后简要地讨论并告诉你 
哪些内容超过课程的范围。你会发现这很有意思，也很有用。 

浏览《爱上统计学》全书你会发现许多小梯子符号，就像在这 
儿看到的。这表明这里有许多步骤，沿着这些步骤可以指导你通 
过特定的过程。这些步骤已通过检验，也被可一个证明这些步 
骤的机构证明。 

绑着蝴蝶结的手指是很可爱的符号，但它的主要目的是用于 
强调你所读到主题的重点。在学4过程中，强调这些重点是由于 
这些重点通常是这个主题的关键。 

《爱 〖:统 计学》的大多数章节提供了一个或多个特殊的统计过 
程和同步计算的详细信息。计算机符号用于表明每章“使用 i j 算 
机…”的部分。 
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本书的许多章节都包含如何使用 spssn. 5 版本来完成同样的统计过 
程的指导，因此你可以手动计算，也可以应用现在的任何一款非常有效的 
统计分析软件包来计算。 


附彔 A 是对 SPSS 的介绍。若准备使用 SPSS ， 通览这个附录是现在要 


完成的任务。如果你有更早的 SPSS 版本（或者是 Max 版本），这些资料仍 
然非常有用。实际 h 最近的 SPSS 视窗版本和 Max 版本『 V :形式和功能方 
面几乎一致。+ 


可以使用附录 C 的数据集来完成本书练习题。每到一章的“使用计 
算机…”部分，就会发现数据集的索引（例如“第二章数据集丨”）。每一个 
数檐集都在附录 C ，如果你按部就班地学习本课程就可以使用这些数据来 
成功地完成“使用计算机…”部分。可以手动建立数据库，也可以从本书 
的网址 http ：// www * sagepub . com / slatbook/datasets 下载数据。只要点击 

Data Sets 然后保存就对以 D 或者从作者自己在堪萨斯大学的网址下载数 

据集 （http ：// www * soeku # edu / faculty / salkind / stats _ fpwhs /) Q 点击 Statistics 

/or Peop / e …进人这本书的主页，然后下载 SPSS 文件。 

从 Sage 的主页和本书的主页也可以下载 Excel 格式的数据集。 


难度指数 


1非常难 
2比较难 
3 一般 
4比较容易 
5非常容易 


小结 


◎ 

◎◎ 

◎©© 

©©◎©◎ 


实际情况不是那么糟，对吧？我们想要鼓励大家继续学习，并且不要 
担心难易程度和时间花费，也不要担心由于太复杂而不能理解和应用。每 
次只学一章，就像现在所做的^ 


练习时间 


因为没存真实事物的替代物，1〜16章的结尾都是习题集，这些习题 
可以帮助你回顾每一章槌盖的内容。而1 1. 也不需要到处找答案，因为这些 
习题的答案也可以在每一章的最后部分找到。 

下面就是第一个习题集。 

1 . 访问一个日常工作中应用统计学的人。这个人可能是你的顾问、指 
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导教师、生活在同一街区的研究者、公司的市场分析人员或城市规划人员。 
询问他或她最喜欢的统计课程。探寻他或她喜欢什么不喜欢什么。他或 
她是否给你一些有助于成功的建议 ^ 而且最重要的是，询问他或她在工作 
中使用这一对你来说是全新的工具 （ 统计学）的方式。 

2. 査阅本地报纸，找出任何主题的调査和访谈的结论。总结这呰结 
论，然后以你的能力尽可能地描述相关的研究人员或者调查人员如何得出 
他们的结论。这个过程可能容易也可能不容易。 一 旦你了解了他们这样 
做的原因，尽力推测其他的收集、整理和汇总同样数据的方法。 

3. 去图书馆复印一些你的专业领域的文章。然后浏览有形象符号标 
示之一的文章，而且重点关注用于整理和分析数据的统计过程部分（通常 
是“结果”部分）。你可能对具体的统计过程了解不多，但是你能识别多少 
不同的统计过程（如 f 检验、均值和标准差的计算）？你是否能完成下一步 
的工作？并且告诉你的老师这些结果和研究问题的关系，或者与最初的研 

' 究课题的关系。 

4-在网上查找四个包含任何主题数据的网址，然后简要介绍所提供的 
数据类型以及数据是如何整理的。例如，登陆数据网址的源头——美国人 

门统计局（ Http :// www . census , gov /) ，你会发现 “’ Access Tools ” 链接，进人 

后的网页提供真实数据的链接。尽力查找适合你的专业的数据和资料。 



第 n 部分 


£珞取 • 偁德和 


精神分析学的奠基人西格玛 • 弗洛伊德 （Sigmund Freud ) $做得很好的一件 
事就是观察和描述他的病人的状况。他是机敏的观察者，应用他的技能发展了 
第一个系统而综合的人格理论。不论你对他的观点的有效性有什么看法，他都 
是一个优秀的科学家。 

回到20世纪早期，统计学课程 （ 就如你所选的统计课程）不是大学生或研究 
生课程表中的必修课。统计学还是相当新的领域，而且科学探索的精神不需要 
统计工具带入科学领域的精确性 o 

但是事情已经发生改变。现在几乎在任何领域，数字都很重要。 《爱 上统计 
学》 的这部分主要致力于了解，在整理了结果数据之后，如何应用统计学描述结 
果并更好地理解结果。 ， • 

第2章讨论集中趋势的测量，以及如何计算多种平均数中的一种以便最好 
地 代表一 组数据。第3章全面介绍用于描述一系列数据点的离散性的工具，包 
括标准差和方差。到了第4章就要准备学习如何描述不同的数据分布或不同的 
数据集之间的差异，以及这种差异的意义。第5章处理变量之间的关系，也就是 
相关关系。 

完成第 n 部分之后,你已经站在了很好的起点上，可以开始理解概率和推论 
在社会科学和行为科学中扮演的角色。 


* Sigmund Freud ， 一般应译为两格蒙德 • 弗洛伊徳。此处作者为了使语言更陕谐有趣，所以采用了“ Z ”符 
号来代替 Sig , 故我们此处将其洋为 •'西 格玛' ——译者注 
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必须完成的功课 
算和理解平均数 


• 了解集中趋势量数 
• 计算一组数据的均值 
• 计算一组数据的众数和中位数 
•选择一种集中趋势量数 


你已经很有耐心了，那么现在就始处理真实、动的数据。这也正 
是你在这一章要做的。一旦收集了数据，第一步通常是整理数据，也就是 
使用简单的指标来描述数据。完成这一步的最容易的方法就是计算几种 
不同形式的平均数。 

平均数 （ average ) 是能够最好地代表一组数据的数值。数据组是30 
个五年级学生的拼写测验的正确个数，还是纽约洋基队的击打率，或者是 
最近的选举中登记为民主党或共和党的人数，这不重要。在所有的案例中 
数据组都可以使用平均数来概括。平均数也叫做集中趋势堡数 （ measures 
of central tendency ), —般有三种形式 ：均值 、中位数和众数。每一种形式 
提供不同的数据分布信息，而且计算和解释都很简单。 

计算均值 

均值 （ mean ) 是计算平均数最常用的形式。均值很简单，就是数据组 
中所有数值的总和除以该组数值的个数。因此如果你有30个五年级学生 
的拼写成绩，将所有的拼写成绩简单地加起来就得到 - 个总和，然后除以 
学生的人数，也就是30。 

公式 2. 1就是均值计算公式。 



其中 

• 上带横线的宇母 1( 读做“ X 把”）是数据组的平均数或均值^ 





2 必须完成的功课——计算和理解平均数 
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• V或希腊字母西格玛是连加符号，也就是将其后的所有数值都加 
起来。 

• X 是数据组中每个具体的数值。 

• 最后， n 是从中计算均值的样本的规模。 



下面是计算均值的 步骤： 

1 一以一列或多列的形式列出所有数值。这些数值就是那些 X 

2— 计算所有数值的总和或总计。 

3 — 总 和或总计除以数值的个数。 


例如，你需要计算三个不同场所的消费者的数量的平均数，你吋以计 
算均值得到这个值。 


场所 

年顾客数量 

兰哈姆公园商店 

2 150 

威廉斯堡商店 

1 534 

下城商店 

3 564 


每个商店顾客数 M 的平均数或均值是2 416。公式2+2表明如何应用 
公式 2.1 计算这个值。瞧，我已经告诉你很容易了。小菜一碟！ 


- Z, X 2 150 + I 534 +3 564 
X ^ —— = --— — ^— 


= 2 416 


( 2 . 2 ) 


需要记忆的内容 



均值有时也用字母 M 表示，也叫做典型平均数或中心值。如 
果你在看其他的统计学书或者研究报肯，就会看到类似 i^-45.87 
逵样的表达式，这就可能意味着均值等于 4 5. 87。 

♦ <w k 面的公式中小写字母》表示从中计算均值的样本的规模。 
大写字母 yy( 像这样的）表示总体规模。在一些书中和一些杂志 
的文章中没有对这两者做出区别。 

• 样本均值是非常准确地反映总体均值的集中趋势■数。 

•均值就像跷跷板I:的支点。均值就是中心点，也就是均值一边 
的所有数值等于均值另一边的所有数值。 

• 最后，不论好坏,均值对极值很敏感。极值会使得均值向一方或 
另一方倾斜，也使得均值对数据绀的代表件减弱，同时作为集中 
趋势 M 数的有效性减弱。当然这依赖于计算均值的数值。后面 
会有更多的讨论。 





3 . : 


均值 m 是指算术平均数 （aritlmietic mean ) ,与然你也会看到其 

他类型的均值，如调和均值。调和均值用于特殊的情况，你现在不 

需要关注。如果你想表现得更专业，算术平均数（也就是我们讨论 

到现在的均值）定义的基点是均值的偏差的总和是0 ( 呦！）。例如 

你有三个值 3 ， 4 和 5 (均值是 4 )，均值的偏差 （-1 、0和1 ) 的总和 
是0。 


，一- 警…… 

:二 =: 均数:的 




以上的案例是如何计算简单的均值。但是有的情况下同样的数值不 

止出现一次，这就需要计算加权平均数。加权平均数可以很容易地计算， 

也就是每一数值乘以它岀现的频数，并将所有的积相加，然后除以频数的 
总和 D 


按照下面的步骤计算加权平 均数： 

1 一列出要计算均值的样本的所有数值，如下表中标签为“数值•’的 
列 中的所 有数值（ X 的值）。 

2 — 列出每一个数值出现的频数。 

3— 每一数值乘以它的频数，如表中第三列所示。 

4 一计算“数值 x 频数”列的所有数值总和。 

5 —除以 频数的总和。 


例如，这个表格整理的数据是100个飞行员飞行效率测验的数值和 




数值 


频数 


数值 x 频数 


60( 不要和这个家伙一起飞行) 
总计 
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加权平均数是8 967/100,或 89.67 D 以这种方式计算均值相对于将 
100个不同的值输人计算器或者计算机软件要容易得多。 


例如，下面是5个家庭的收入。 

135 456美元 
25 500美元 
32 456美元 
54 365美元 
37 668美元 

下面是将收入从大到小排序后的清单。 

135 456美元 

54 365美元 
37 668美元 
32 456美元 
25 500美元 

—共是5个数值。屮间位置的数值是3 7 66 8美元，也就是中位数。 

现在，如果数值的个数是偶数怎么计算？我们在收入清单中增加一个 
数值（3 4 500美元），那么就有6个收人数值。如下 所示。 


中位数也是平均数，但是是非常不同的形式。中位数 ( median ) 被定 
义为一系列数据的中点。在这一数据点所有数据的一半也就是50%在其 
之上而另一半或者说50%在其之下。中位数有一些特别的性质，我们会 

在这一节后面的部分寸论，现在集中精力考虑如何计算。计算中位数没有 
标准公式。 . 


在基础统计学部分要做的一个重要区別是样本（总体的一部 

分）值和总体值。统计分析师依据下面的方式进行区别。样本统 

计值 （ 例如样本均值）使用罗马 字母； 总体参数值（例如总体均值） 

g 用希腊字母。因此100个五年级学生的拼写成绩的均值表示为 

元，而所有五年级学生的拼写成绩的均值表示为 M5 ，使用的是希腊 
字母 I11U 或从。 


计算中位数 


下面是计算中位数的 步骤： 

1— 以从大到、或者从小到大的顺序列出数值。 

2— 找到位于中间位置的数值。那就是中位数。 
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/ 






135 456美元 ♦ 

54 365美元 , 

37 668美元 
34 500美元 
32 456美元 
25 500美元 

如果数值个数是偶数，屮位数就是中间两个数值的平均数。在这个案 
例中中间的两个数值是3 4 500美元和3 7 6 68美元。这两个数值的平均数 
是36 084美元^这就是6 1、数值的数据集的中位数。 

如果中间的两个数值相同怎么计算，就如下面的数据集？ 

45 678美元 

25 567美元 
25 567美元 
13 234美元 

那么中位数和中间的两个数值相同。在这个案例中中位数是25 567 

美元。 


现在给出一些问题的答案，这些问题可能在开始讨论中位数时就出现 
在你的头脑中了。为什么使用中位数而不是均值？ 一个非常好的原因是 
中位数对极值不敏感而均值却不是。 

如果你的数据集中有一个或多个极值，中位数相对其他集中趋势 M 数 
来说能更好地代表数据集的中心值。是的，甚至比均值更好。 

我们所说的极值是什么？非常容易就可以想到 ，一 个极值就是与其所 
属数据组非常不同的值。例如，考虑之前的案例中已经用过的收入清单, 
在这里再次列出： 

135 456美元 
54 365美元 
37 668美元 
32 456美元 
25 500美元 


如果你丫解中位数，也应该知道百分位点 （percentile points ) 。 
「 I 分位点 用于定义数据集或数据分布屮等于或者小于一个特定数 
据值的个 I 本的 H 分数。例如，你的成绩是“处在75百分位点”，这 
意味着成绩分布中你的成绩刚好是或者超过75%的其他人的成 
绩。大家也知道中位数是50 W 分位点，因为数据分布中50%的个 
体在这一点之下。其他的百分位点也很有用，如25百分位点，通 
常用 A 表述，75百分位点，通 常用认 表示。那么 ^呢？ 当然是 
中位数。 


2 必须完成的功课——计算和理解平均数 
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这组数据中数值135 456美元与其他4个数值之间的差异较大。我 
们可以认为这个数值就是极值。 

最好的说明中位数作为集屮趋 势餘数 是多么有用的方法是计算包含 
一个或多个极值的同一数据集的均值和中位数，然后比较哪一个值能更好 
地代表数据集。现在就来计算和比较。 

上面有5个收人数值的数据组的平均数或均值是5个数值的总和除 
以5,结果是57 089美元。而这个数据组的中位数是37 668美元 D 哪一个 
值能更好地代表这个数据组？数值 37 66 8美元更加明显地位于数据组的 
中间，但是我们习惯于认为平均数具有代表性或者占据中间位置。事实 
上，均值 57 089美元在第4高位数值 ( 54 365美元）之上，不是这个数据分 
布的中间值，也不具有代表性。 

就是由于这个原因，特定的社会和经济指标（大多数与收入相关）的 
分析使用中位数作为集中趋势量数，例如 44 美国家庭平均收人的中位数是 
……，”而不是使用均值來概括收人。总是存在太多的汲值改变或者明显 
地扭曲一个数据组或者数据分布的中心点。 





表示 


¥大写字母， 





r ^。 祅吾沉仗用于母 is 是一些人会将 M 和均值混淆 

疏表示中位数。不要让这些拌住 

什么，你孤小贫行社选』 




这些不同符号的困 

-_,— 人__ 




需要记忆的内容 

这些有关中位数的内容十分重要也很有趣，需要记忆。 

• 均值是一系列数值的中间点，而中位数是一系列个体的中间点。 

• 因为屮位数关注的是有多少个体而不是这些个体的数值，极值（_有 
时也叫做奇异值）就不会产生影响。 

计算众数 

我们要学习的第三个也是最后一个集中趋 势量数 是众数，也是最笼 
统、最不精确的集中趋势鼠数，但是在理解特定的数据集的特征中扮演着 
非常重要的角色。众数 （ mode ) 就是出现次数最多的数值。没有计算众数 
的公式。 
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按照下面的步骤计算众数： 

1 一列出一个数据分布中的所有数值，但是每一个数值只列出 
一 次。 

2— 计算每个数值出现的次数。 

3— 岀现次数最多的数值就是众数。 


例如，调査300个人的政党 背嚴会 形成如下的数据分布结果。 


政党背景 

次数或频数 

民主党 

90 

共和党 

70 

无党派人士 

140 


众数是出现次数最多的数值，在上面的例子中是无党派人士。这就是 
数据分布的众数。 , • 

你知道计算众数时最容易、最经常出现的错误是什 么吗？ 就是选择某 
个分类选项出现的次数而不是分类选项的标签本身。对一些人来说很容 
易就可以得出众数是140而不是无党派人士，为什么？因为他们看到的是 

数值出现的次数，而不是最经常出现的那个数值！送是 一 个稍不留神就会 
犯下的错误，因此让你计算众数时一定要注意。 

双峰分布的革果派 


如果数据分布中 


1、数攸的出现次数都相同，那么就没有众数。 



是如果不止一个数值的出现频数相同,那么这彳、数据分布是多峰分布。数 
据集可能是双峰分布 （ 有两个众数）的，如下面头发颜色构成的数据组所示。 


头发颜色 

次数或频数 

红色 

7 

金色 

12 

黑色 

45 

棕色 

45 


在上面的案例中，数据是双峰分布，因为黑色头发和棕色头发出现的 
频数相同。如果众数相当接近但不是完全相同，数据分布也是双峰分布, 
如45个人的头发是黑色，44个人的头发是棕色 D 问题就成为一种类别在 
多大的程度上与其他类别相区分？你的数据是否是三峰分布的？那就是 
说出现了三个频数相同的数值。一般来说是不可能的，特別是在处理大的 
数据集过程中，但出现的可能性是存在的。 


2 必须完成的功课——计算和理解平均数 
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何时用什么 

好吧，我们已经定义了三种不同的集中趋势量数，而且每一种都给出 
了简单明白的案例。但是还有一个最重要的问题没有回答，即“何时使用 
哪一种测量类型？” 

一般来说，使用哪一种集中趋势量数依赖于你描述的数据类型。毫无 
疑问，定性数据、类别数据或定类数据（如种族群体、眼睛颜色、收入档次、 
选举次序以及邻里位置）的集中趋势只可以使用众数来描述。 

例如,你不能使用中心值来描述哪种政治立场在一个组中占有优势, 
也不能使用均值——难道你可以得出结论说每一个人是半个共和党？而 
300个人中几乎一半 （140) 是无党派人士似乎是描述这个变量值的最好方 
式。 一 般来说，中位数和均值最适合于定 M 数据，如身高、具体收入水平 
(不是分类变量）、年龄、考试成绩、反应时间和一定程度上完成工作需要 
的时间。 

当然也可以很公平地说均值是比中位数更精确的测量，中位数是比众 
数更精确的测 S 。 这意味着其他条件相同的情况下使用均值，而且均值也 
的确是最常用的集中趋势 董数。 祖是，我们的确会遇到一些均值不适合作 
为集中趋势量数的情况——例如我们收集的数据是类别数据或定类数据, 
例如头发颜色。那么我们使用众数。因此，这里的三项原则可能会有一定 
的帮助。但是要记住例外始终存在。 

1. 如果数据属性是分类的，而且数值只属于一种类型，例如头发颜色、 
政治背景、邻里位置和宗教，就使用众数。在这种情况下各个分类之间是 
互斥的。 

2. 如果数据中包含极值而巨你不想扭曲平均数就使用中位数，例如 
收人=> 

3. 最后，如果数据不包括极值也不是分类数据就使用均值，例如考试 
得分或游50码需要的时间。 


应用计算机并计算描述统计值 




现在使用 SPSS 来计算一些描述统计值。我们使用名称是第2 
章数据集1 ( Chapter 2 Data Set 1 ) 的数据集，可以在附录 C 得到，也 
可以从 Sage 的网址或者《爱上统计学》的主页下载。这个数据集 
只有一个变量。 
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Prej 依据量表测 M 的偏见数值 , 值域是 



本章讨论的集中趋势量数可以依据下面的步骤来计算。按照 
这个步骤实际操作。通过现在这个练习和包括数据录入和下载的 
所有练习，我们假定数据集已经在 SPSS 打开。 

】， Analyze—^Descriptive Statistics —► Frequencies 

2 •双击变量 Prej 将它转移到 Variable ( s ) 框。 

3 - 点击 Statistics ， 你会看到如图 2. 】所 7 TC 的 Frequencies : Statis ¬ 
tics 对话框。 



_ ■ …- 


Minimum 




Ffegyencies: Slalislics 






r Percentile Values 


Continue ； 
_ — : _ 

麵 

Cancel I 

1 

Help I 

2 V f J 


.MJ 叫， 

「 D ISp _rr 
I 广 S!d deviation 

Variance 






... ^ 


Vajues are group midpoints 

Distribution — *~~n 
Skewness ' 


图 2* 1 SPSS 中的频数分析对话框 

4■在 Central Tendency 下方，点击 Mean 、 Median 和 Mode X 亍应 
的方框。 

5, 点击 Continue 0 

6. 点击 0 K 。 


SPSS 输出结果 

图 2.2 所示是变量 p re j 在 SPSS 中的输出结果 
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图 2. 2 SPSS 的描述统计值 

在输岀结果的 Statistics 部分，你 Pj 以看到一定样本规模数据 
的均值、中位数和众数的计算结果， Ifi 〖且没有缺失数据。 SPSS 在输 
出结果中不使用符号 I 。而且输出结果中也列出了每一个数值的 
频数和每一个数值发生次数的百分比，这都是有用的数据描述 

信息。 . _ 



^ ^ ^ —^ ^ 1 

紗 些奇怪，如果你在 SPSS t 选择 Ana — Descript — 

tic ^ Descriptive ^^^^ Options ， 你会发现没有 median ^ made 
什么？统计分析软件之间差异很大，同样的内容选择使用不同的 

. 1： :: J ； ； ，!-々![. ‘二「：’ . - r t a I '."1.：；;:; ;；：= : -- i ； ：：："■? ^省接 

名称，而且对内容分布设置了不同的假定。如果你不能找到你要 
找的内容，那它可能在另一个部分，你矣坚持找下去。而且一定要 
使用 Help 选项来帮助浏览所有新的信息，直到你找到你需要的内 
容。 






伽 — 


统计分析软件之间差异狀同样的内容选择使用 不同的 




匯 










■: . 








1纖 



小结 

不论你的统计技术掌握到何种程度，几乎都要从简单的描述开始——因此 
理解简单的集中趋势的概念很重要。从现在开始，我们学习另 一 个重要的描述 
概念——变异性，也就是数值之间如何的 不同。 
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练习时间 

1，计算下面给出的第2章数据集 2( Chapter 2 Data Set 2 ) 的三个数据组的均 

值、中位数和众数。可以手动计算或者使用统计软件如 SPSS 。 给出计算结果，如 
果使用 SPSS , 打印输出结果。 


数据组1 

数据组2 

数据组3 

1 

34 

154 

7 

54 

167 

5 

17 

132 

4 

26 

145 

5 

34 

154 

6 

25 

145 

7 

14 

113 

8 

24 

156 

6 

25 

154 

5 

23 

123 


2 -假定你是快食店经理。你的工作之一是向老板汇报每天哪一种特惠食品 

卖得最好。应用你学到的描述统计的知识，写一个简短的报告让老板知道每天 

的经营状况。不要使用 SPSS 计算重要的数值，而是手动计算。记住备份你的计 
算结果。 


特惠食品 

售出数量 

价格(美元） 

Huge Burger 

20 

2.95 

Baby Burger 

18 

L 49 

Chicken Littles 

25 

3-50 

Porker Burger 

19 

2.95 

Yummy Bugger 

17 

1,99 

Coney Dog 

20 

1,99 

售出总数 

119 



3■在什么情况下使用中位数而不是均值作为集中趋势量数？为 什么？ 给出 
两个案例说明中位数作为集中趋势量数比均值更有效。 

练习参考答案 

1 . 



数据组 I 数据组2 数据组3 


均值 5*1 27.6 144,3 

中位数 5.5 25.0 149,5 

众数 5 25和34 154 


2,你写的报告可能是这样的: 
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与通常一样 ， Chicken Uttles (众数）销售量最高。食品销售总额是303美元， 
特惠食品的平均价格是 2.55 美元。 

3,如果数据存在极值就使用中位数，因为极值会使均值偏离。一个案例是 
汇报收入时中位数优于均值。因力均值变化较大，而你需要对极值不敏感的集 
中趋势量数。另一个案例是存在极值或奇异值的数据，例如一组青少年跑100 
码的速度存在极值或奇异值，也就是有一两个人跑得特别的快。 



ft 别差异——理解变异性 



• 为什么变异性是有用的描述工具 
• 如何计算极差、标准差和方差 


• 标准差和方差如何类似——-又如何不同 


为什么理解变异性很重要 

在第2章已经学习 了不同 类型的平均数，他们的含义，如何计算，以及 
何时使用。但是谈到描述统计和数据分布特征的描述，平均数只是一部 
分，另一部分是变异性（或离散）量数。 

在最简单的词汇中变异性 （ variability ) 反映数值之间的不同。例如下 
面的一组数据体现了一定程度的变 异性： 

7，6，3，3 

接下来的另一组数据具有与之相同的均值 （4) ，但变异性小于前一个 
数 据集： 


3,4,4,5,4 


数值之间没有差异，但是还是和前 


下一个数据集根本没有变异性—— 

面所示的两组数据具有相同的均值。 

4,4,4,4,4 

变异性 （ 也叫做散布或离散度）可被看作是对不同数值之间的差异性的 
测量。如果把变异性看作是每个数值和特定值的差异程度可能更精确（而 
且也许更容易）。那么你认为哪一个“数值”可能被作为那个“特定值”呢? 


常情况下这个“特定值”就是均值 • 


很正确。因此，变异性成为测量数 


据组中每一个数值与均值的差异性的量数。接下来还会继续讨论 


要记住你已了解的关于计算平均数的内容 


平均数（不论是均值 


中位数还是众数）是一组数据的代表数值。那么现在增加关于变异性的 
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新知识 • 


它反映的是不同数值和一个值的差异性。两者都是重要的描 


述统计值。这两个值（平均数和变异性）可共同用于描述数据分布的特 
征，并说明数据分布之间的差异。 

变异性的三种量数通常用于反映一组数据的变异性、散布或者离散 
度。这三种 M 数就是极差、标准差和方差。接下来让我们更详细地了解每 
一个量数以及如何应用。 • 


计算极差 

极差是对变异性最笼统的测量。极差可让你 r 解数值之间彼此差异 
的程度。极差 ( range ) 是通过数据分布中的最大值减去最小值来计算。 

一 般来说，极差的计算公式如下： 

r - h ^ I (3,1) 


其中 

^是极差 

办是数据集中的最大值 
/是数据集中的最小值 
以下面的数据组（以降序的形式排列） 为例: 

98,86,77,56,48 
在这个案例中，98 -48 =50。极差是50。 



实际上极差有两种类型。一种是不包含极差，就是用最大值 
减去最小值 4-/) ，也是我们刚刚定义的极差。第二种极差是包 
含极差，就是最大值减去最小值再加 + 1)。在研究性文章 
中通常看到的是不包含极差，但一些研究人员更喜欢使用包含极 
差，所以也偶尔会在文章中看到。 


极差几乎都用于得到不同值之间相互差别或离散程度的非常笼统的 
估计——也就是极差表示一个数据分布中从最小值到最大值之间的距离。 

因此，虽然极差作为变异性的一般指标很好，但是不可以用于得出任 
何关于具体的数值之间相互差别的结论。 

计算标准差 

现在开始学习最常用到的变异性量数——标准差。如果仅仅考虑宇 

面的含义，就是标准化了的与某个值 （猜猜 是哪一个值）的偏差。实际上， 
标准差 （slandard deviation ，缩写为 s 或 SZ >> 表示一个数据组中变异性的平 
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均数量。实际的含义是与均值的平均距离。标准差越大，每一个数据点与 

ii 

数据分布的均值的平均距离越大。 

因此，支持标准差计算的逻辑是什么？你最初的想法可能是计算数据 
组的均值，接着用均值减去每一个数值。然后计算这些距离的平均数。 

这个想法很好——最后你会得到每一个数值与均值的平均距离。但 
是实际上这不管用（你是否知道为什么，接下来我们会说明原因）。 

下面给出计算标准差的 公式： 

(3.2) 


其中 

s 是标准差 

X 是西格玛，表示将其后所有数值累加求和 

x 是具体的数值 
i 是所有数值的均值 
^是样本规模 

公式中可以看到每一个数值和均值之间的差 （ X - It )， 每一个差的平 
方，并且计算所有平方值的总和。然后用平方和除以样本规模（减去1)， 
最后求平方根。就如你所看到的，也和我们争巳指出的一样，标准差是每 
个数值与均值的偏差的平均数。 

我们用下面的数据逐步解释如何计算标 准差： 

5，8，5，4，6，7，8，8，3，6 


1 一列出每一个数值。数值如何排序不重要。 

2— 计算数据组的均值。 

3— 每一个数值减去均值。 

下面就是我们现在完成的工作，其中 X - ^表示每一个数值与所有 
数值的均值之间的差，均值是6。 
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4 一计算每一个差值的平方 D 计算结果在对应的（％ 

- I ) 2 列 o 




8 

8*6= +2 

4 

8 

8 - 6 = +2 

4 

8 

8-6= +2 

4 ， 

7 

7— 6= +1 

i 

6 

6—6-0 

0 

6 

6 -6 =0 

0 

5 

5 - 6 = — 1 

1 

5 

5 -6= -1 

i 

4 

4— 6= -2 

4 

3 

3-6^ -3 

9 

合计 

0 

28 


5— 计算所有与均值的偏差的平方的总和如在上表中看到的，总 
和是28。 

6— 平方和除以 ra -1, 也就是 10-1 =9,那么28/9 =3, 11。 

7— 计算 3. 11的平方根，结果是 1.76( 四舍五人之后）。也就是送 
10个数值的标准差。 


从结果我们可以知道，数据分布中每一个数值与均值的偏差的个均数 
是 1. 76 0 

现在我们做一个简短的回顾，分析一下运用标准差公式的计算过程。 
这些过程很重要，需要回顾，而且会增加对标准差是什么的理解。 

首先,为什么我们不简单地将与均值的偏差累加起来？因为与均值偏 
差的总和一般都等于 0 o 试着计算偏差 （2 +2+2 + 1 +0+0-1 - 1 -2- 
3) 的总和。实际上，这也是检査均值计算是否正确的最好方式。 


+• 





你可能会看到另一种类型的偏差，而且你应该了解它的含义。 
平均偏差 （ mean 也 I M 故平均绝对偏差）是与均值偏差的绝 

对值的总和。你已经知道与均值偏差的总和一定等于 0( 否则就可 
能是均值计算错误）。那么，我们取每一个偏差的绝对值（也就是 
不管正负号的数值）。将这些绝对值累加起来，然后除以数据点的 
个数，你就得到平均偏差（注意：一个数的绝对值通常用两边带有 
竖线的数值表示，就如彳51。例如 -6 的绝对值是丨 -61 ,也就是 


6 ) 


其次，为什么我们计算偏差的平方？因为我们想消除负号，这样就使 
得累加偏差的时候总和不为0。 

最后，为什么第7步是以计算总值的平方根来结朿？因为我们想回到 
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幵始时的计算单位。我们在第4步计算与均值偏差的平方（消除负值）， 
接着在第 7 步 i 十算总值的平方根。这就是有始有终。 

为什么使用 n - 1,而不 An 

你可能已经猜出我彳 I '】为什么对均值偏差进行平方，以及为什么求总和 
的平方根。但是为什么公式中的分母要减去1呢？为什么我们除以 n -1 
而不只是呢？这是个很好的问题。 

答案是 s (标准差）是总体标准差的估计值，但是只有我们用减去1 
的情况 K 才是无偏估计。我们把分母减去1会使得标准差大于实际的大 
小。为什么我们要这样做？因为好的科学家一般都是保守的。保守的含 
义是，如果我们不得不出错，我们出错也是由于过高估计了总体的标准差。 
除以较小的分母可让我们做到这一点。因此，我们除以 9 而不是〖0,或者 
我们是除以99而不是100。 




如果你的目的是描述样本的特征，有偏估计也可以。但如果 
你想用样本估计总体参数，最好要计算无偏统计值。 


看看下面的数据表，你会发现样本规模变大（并且逐渐接近总体规 
模）会发生什么。 n ~ l 的调整对于标准差的有偏估计和无偏估计之间的 
差异的影响越来越小（数据表中黑体字一栏）。其他各项一致的情况下， 
样本规模越大标准差的有偏估计和无偏估计之间的差异越小。认真看下 


面的数据表，你会了解我们所说的内容。 


样本规模 

公式中分子 
的数值 

总体标准差的有 
偏估计（除以 n .) 

总体标准差的无 
偏估计(除以 1) 

有偏估计和 
无偏估计的差异 


500 

7,07 

7,45 

0 . 38 

100 

500 

124 

2, 25 

0 . 01 

1 000 

500 

0. 707 1 

0. 707 5 

0 . 000 4 


那么其中的规律是什么？当你计算样本的标准差用于估计总体的参 
数值时，样本规模越接近总体规模，估计就会越准确。 

重要的是什么 

标准差的计算很简单。但是标准差的含义是什么？作为一个变异性的 
量数，标准差可以告诉我们数据组的每一个数值与均值的偏差平均数。但 
足就如在第四章可以看到的，标准差有一些非常实际的应用。为了刺激学 
习的兴趣，考虑这一点:标准差可用于帮助我们比较来自不同数据分布的数 
值，即使均值和标准差不同。很奇妙吧！这就如你将会看到的，非常酷。 
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需要记忆的内容 



• 标准差是作为偏离均值的平均距离计算的。因此，你首先需要计 
算作为集中趋势量数的均值。因此计算标准差时不需要在中位数 

和众数上浪费时间。 * 

•标准差越大，数值分布越广，则数值之间的相互差异越大。 

• 和均值一样，标准差对极值很敏感。当你计算样本的标准差时，若 
数据中存在极值，你就要在数据报告中注明这一点。 

• 如果 S = 0,数据组中就绝对没有变异性，而且在数值上完全一致。 

这种情况很少发生。 


计算方差 

这是另一个变异性量数，而且也让人感到惊奇。如果你知道一个数据 
组的标准差，而且可以计算一个数的平方，那就可以很容易地计算相同数 
据组的方差。 第三 个变异性量数，也就是方差 （ vari ance) ，就是标准差的 

平方。 

换句话说，就是你之前看到的公式，只是没有平方根符号，就如公式 
3. 3 所示： 



(3.3) 


如果你计算标准差时没有完成最后一步（计算平方根），那就得到方 
差。换句 话说/ X 5, 就是方差等于标准差自乘一次（或平方）。在我 
们的早前案例中，标准差等于1.76,方差等于1.76 2 ,也就是 3. 11。 

你不大可能在杂志的文章中看到方差被提到，或者看到方差被用作描 
述统计。这是因为方差值很难解释或很难用于一组数据。总之，方差来自 
于偏差值的平方。 

但是方差很重要，因为方差不仅是一个概念，也是许多统计公式和技 
凇中实际应用的变异性量数。你会在《爱上统计学》后面的部分丫解 

更多。 


括准差与方差 


标准差和方差哪些方面相同，哪些方面不同？ 

它们都是变异性、离散度或散布的量数。用于计算两者的公式非常类 
似。你常常会在杂志文章的“结果”部分看到两者。 


但是它们也非常的不同。 

首先而且最重要的是，标准差（因为我们计算偏差平方和均值的平方 
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根）以最初的计算单位存在。方差以平方单位存在（没有计算平方 根〉。 

这是什么意思？假定我们需要知道一组装配电路板的生产工人的变 
异性。我们假定他们每个小时平均装配 8. 6个电路板，标准差是 1. 59。 

数值 1-59 的意义是每个小时装配的电路板与均值的平均差异是 1. 59个 
电路板。 

让我们看看方差的解释，方差是 1. 59 : ，或 2. 53。方差可解释的含义 
是工人每个小时安装的电路板与均值的平均差异的平方大约是 2. 53个电 
路板。这两个值哪个更有解释意义？ 

使用计算机计算变异性量数 



我们1也用 SPSS 软件计算变异性 M 数。我们使用的数据文件 
是第3章数据集 1 ( Chapter 3 Data Set 1 ) 。 

这个数据集只有一个 变量： 


变董 

定义 

reac_tm 

敲击作业的反应时间 


下面是计算本章讨论的变异性量数的 步骤： 

1 . 打开名称为第 3 章数据集1 ( Chapter 3 Data Set 1 ) 的文件。 
2* Analyze — ►Descriptive Statistics-^l requencies 0 

3, 双击变站 reac 一 tm 将变瞳 reac _ tm 移到 Variability ( s ) 框。 

4 . 点击 Statistics ，你会看到 Frequencies；Statistics 对话框。使用 
这个对话框来选择你想要运行的变最和程序。 

5 •在 Dispersion 选项下，点击 Std . Deviation Q 
6■在 Dispersion 选项下，点击 Variance Q 
7 * 在 Dispersion 选项下，点击 Range G 

8. 点击 Continue 。 

9. 点击 OK 。 


SPSS 输出结果 


图 3. 1 所示是变 M reac _ tm 在 SPSS 中的输出结果。这里有30个有效 
案例，而且没有缺失案例，而 j L 标准差是 .702 5 5。方差（或， ） 等于 .493 57, 


极差是 2. 60。 


^根裾上下文意思应是——译者注 
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3, 1 变碰 reac_tm 的输出结果 


你可能已经注意到 SPSS 只允许变量标签不超过8个字节，而 
没有大写字母和空格。这是因为 SPSS 仍然受到老版本 MS-DOS 
吏盘操作系统）的8字节限制的局限。这些限制带来许多不便, 




) 的变量的标签就成为 


reac 


flEAC Ttt 

H vntitf 

Hitting 

卿 OlW ) 刚 

V#nfln£t 

W 

0 

iO?W 

5 肋 





变异性量数帮助我们更全面地了解数据点的分布。与集中趋势量数一起， 
我们可以使用这些数值来区别不同的数据分布，而且有效地描述一组考试分数、 
身高或个性测量得分的分布。现在我们可以思考和讨论数据分布，也让我们能 
够以不同的方式来考察这些数据。 


练习时间 

I 为什么极差是最方便的离散量数？而且是最不精确的变异性量数？我们 
何时使用极差？ 

2. 计算下面的数据集的极差、无偏标准差、有偏标准差和方差。请手动 
计算。 

31,42,35,55,54,34,25,44,35 

3. 为什么无偏估计大于有偏估计？ 
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4.使用名称为第3章数据集 2( Cha P t ^3 Data Set 2 ) 的数据文件中所包含的 
数据进行练习。这个数据集中有两个变量。 


变 it 

定义 

身高 

单位是英寸的身高 

体重 

单位是磅的体重 


使用 SPSS 计算身高和体重的所有变异性量数。 SPSS 计算的是有偏还是无 
偏估计？你怎么知道的？ 

练习参考答案 

1•极差是最方便的离散量数，因为极差只需要用一个数（最大值）减去另一 
个数（最小值）。因为极差没有考虑数据分布中最大值和最小值之间的数值，所 
以极差不精确。如果你需要一个大概（而不是非常精确）的数据分布的变异性估 
计，就使用极差。 


2. 极差是30。 



无偏估计 

有偏估计 

S 

10. 19 

9.60 


无偏的样本标准差等于 10. 19。有偏的样本标准差等于 9. 6。两者的差异是 
由于一个除以样本规模 8( 是无偏估计），而另一个除以样本规模 9( 是有偏估 
计）。方差的无偏估计是 103. 78,有偏估计是92.25。 

3. 因为我们有目的地要保持保守性，并倾向于高估总体标准差的大小，所以 
无偏估计总是大于有偏估计。 

4 ■下面 的统计表给出了汇总的统计结果。看起来很熟悉？它应该-实际 

上就像 SPSS 的输出结果。 

统计值 

__ 身高 _ 体重 

/V 有效案例 20 20 

缺失案例 0 0 


差 

淮差差 

标方极 



幅图真的相当于千言万语 



• 为什么一幅图真的相当于千言万语 
• 如何建立直方图和多边形图 
• 不同类型的统计表和它们的应用 
• 使用 Excel 和 SPSS 建立统计图表 


为什么要用图表说明数据 


前面的两章已经学习了两种类型的描述统计——集中趋势 it 数和变异 
性量数。这两者可以提共一个最好的值描述一组数据（集中趋势），以及测 
量数值之间彼此差异或不同的程度（变异性）。 

我们之前没有做而现在要做的是考察看起来不同的数据分布中两类 


测量结果的差异程度。数宇本身（例如义=10 ^ = 3 ) 很重要，但是形象地 
表示是更有效地描述数据分布特征和数据集特征的方式。 

因此在这一章我们将学习如何形象地表示数值的分布，以及如何使用 
不同类型的图形来表示不同类型的数据。 


好图表的十个方面（少贪新，多练习) 


无论你是手动或者使用计算机软件建立图形，这些实用的图形设计原 
则都适用。这里有十条原则需要参照，而且应该挂在你的案头。 

5 .减少图或表中无用的内容。“图表垃圾”（类似于“废话”）是指使 
用了计算机软件的每一个函数、图表和性能，由此制作的图表中密密麻麻 
地挤满了没用的信息。这类东西绝对是越少越好。 

2. 在开始制作最后的图表之前要制作草图。即使准备使用计算机软 
件制作图表也要使用制图纸。 

3 . 说想说的，而且说了要说的——不多不少 o 没有比堆积图表（附带 
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太多的文字和花哨的特征）迷惑读者更坏的事情了。 

4. 给所有的内容贴标签，不要留下让读者不理解的内容。 

5- 一个图表应该只传递一个观点。 

6. 保持图表平衡。建立图表时，标题和数轴标签要置中。 

7. 保持图表的比例^比例是指横轴和纵轴之间的关系。这里的比例 
通常是3比4,也就是图表的宽若是3英寸，那么高就是4英寸。 

8 . 简单最好。保持图表简单，但不能过于简化。尽可能只表达一个观 

点，而减去的信息在接下来的正文中保留。记住 ，一 个图或表应该单独存 
在，而且读者能够理解传递的信息。 ' 

9. 限制你所使用的单词数目。单词太多或者单词宁 W 数太多，就会削 
弱你的图表传递的直观信息。 

10. —个图要能够传递你要表达的内容。如果不能，返回准备阶段重 
新制作。 

首先是建立频数分布 

用图表说明数据的最基本的方式是建立频数分布。频数分布 （ fre - 
quency distribuUon ) 是记录和展现特定数据岀现次数多少的方法。在建立 

频数分布过程中•数值通常依据一定的组距或数值范围分组。 

现有的数据是50个阅读理解考试的成绩，以及这呰考试成绩的频数分布。 
下面是建立频数分布的原始 数据： 


这是频数分佰 表: 


组距 

频数 

45 -49 

1 

40 ~44 

2 

35 ^39 

4 

30-34 

8 

25 ~29 

10 

20~24 

10 

15 ~19 

8 

10^14 

4 

5〜9 

2 
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組距 

就如你在上表中所看到 ，组距 （tlass interval ) 是一个彳 I I 域范阐，而 _ E 1 建 

立频数分布的第一步就是定义每一个组距的大小。在我们建立的频数分 
布中可以看到，每一个组距包含5个值，例如5 〜 9( 包含5,6,7,8和 9) 和 
40 ~44(包含 40 t 41 ,42,43和 44) Q 我们如何决定一个组距只包含5个值？ 
为什么不是各包含10个数值的5个组距？或者各包含25个数值的两个 

组距？ ' 

不论你处理的数据集中数值的规模有多大，建立组距要参照如下一些 

一 般原则。 

1. 选择一个包含2，5，10或20个数据点的组距 o 在我们的案例中，选 
择了包含5个数据点的组距。 

2. 选择一个组距，使得⑴ 〜 20个这样的组距就可以覆盖所有的数据。 
完成这一步的简便方式是计算极差 * 接着除以你想使用的组距的个数 （ 10 
- 20)。在我们的案例中有50个数值，而且我们想用10个组距：50/ 〗 0 = 
5,这就是每一个组距的规模。如果你有一个值域范围是100 -400 的数据 
集，你可以从下面的估计开始并以此为基础计算：300/ 2 0 = 15,因此15就‘ 

是组距。 

3. 根据组距把所苻分组罗列出来。在之前给出的频数分布中，组距是 
5,而且我们的最低组距以0开始。 

4. 最后，最大的组距处在频数分布的顶端。 

一 旦建立了组距，就着手完成频数分布的频数部分。这就是简卑的计 
算原始数据中每一个数值出现的次数，接着将这个数字放入这个数值代表 

的组距。 

在我们之前建立的频数分布中，在 30 和 34 之间出现的数值的个数或 
在30 ~ 34的组距中数值的个数是8。因此,8写人频数所对应的列。这就 

是频数分布。 

图形密度 ■.建 立直方图 

现在，我们已经得到了多少数值落人对应组距的记录，接着就进人下 


一步并建立直方图 ~一 -频数分布的形象表示，图中频数以条形 表示。 




图 4 . I 沿 X - 轴的组距 

2—围绕每一个代表组距的组中值 （ midpoint ) 绘制高度为代表这个 
组距频数的条形或 柱形。 例如在图 4 , 2中，你可以看到的第一 
个条形，也就是0〜4组距是由频数1代表 （表示 1乘以0到 4 
之间的一个值）。继续绘制条形或柱形直到每一个组距的频数 
都用图形得到表示。下面是一幅很不错的手绘的表示我们之 
前提到的50个数值的频数分布的直方图^ 

注意每一个组距是如何由 x 轴的一定值域代表的。 
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0246 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 

组距和组中值 ( I ) 


万卷方诛 


爱上统计学 


依据下面的步骤建立直方图。 

1— 使用制图纸，在 X - 轴等距离地列出数值，如图 4. 1所示。现在 
确定组距的组中值，也就是位于组距中间的数据点。组中值很 
容易计算 ，一 眼就看得出来，但是你也可以简单地将组距的最 
大值和最小值加起来然后除以2。例如0〜4组距的组中值楚0 


和4的平均数，也就是4/2 


is laEIB ssssss_SSHS_SS^H 

KissH 结 smssHHi EH 

I■l■i■l■ 圜 i■ss■■■_s_■ss■■ ■■ s!^H 


11^ 

■■■發韓韓韓發韓韓韓| 

I 

b 圍__圖^^ 
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组距 


组中值 


4.2 手绘直方图 


针教方法 

通过在这一章开始看到的简单的频数分布表就可以了解，比起简单地 
列出数据，你可以对数值分布 r 解更多。你会对么数据和数据发生的 
频数有很好的了解。但是另外的形象表示（直方图之外）可以通过对每一 
个数值发生的次数的记录来完成，如图4, 3所示。 
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图 4. 3记录数值 

我们使用与特定组距所包含的数值的频数一致的记录。这种方式司 
以更直观地表示一个数值相对于另一个数值出现的次数的多少。 

下- '步： 频教多边形图 

建立直方图或数值记录图不是很闽难，而一下步（下一个用图形说明 
数据的方式）更容易。我彳|、 ] 准备使用相同的数据—实际上就是刚才建 

立的直方阁-建立频数多边形图 （frequency polygon ) 0 频数多边形图是 

代表组距内数值频数的连续线段，如图 4.4 所示。 

















S 6 


0-4 5«9 10-14 15 〜 19 20-24 25^29 3Q-34 35 〜 39 40^44 45-49 

组距 


图 4. 4 手绘频数多边形图 


如何绘制频数多边形图？按照下面的步骤來做。 

1 一在直方图的条形或柱形的顶端设置组中值。（见图 4.4) 
2—用线段连接组中值就得到它——数多边形图。 


注意在图 4. 4 中，作为频数多边形图建立基础的直方图是用横线和發 
线绘制，而多边形图是用曲线绘制。这是因为，即使我们想让你看到频数 
多边形图建立的基础，通常你也看不到在多边形图之下的直方图。 

为什么使用频数多边形图时不是直方图来表示数据？频数多边形图 
是更优的选择。频数多边形图看起来比直方图（表示频数变化的直线看 
起来总是更整齐）更生动，但是基本上涵盖的是相同的信息。 
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累计频教 

如果建立了频数分布，而且已经用直方图或频数多边形图对那些数据 
进行了形象地解释，那么还有另一种选择就是建立组距内数值的累计发生 
频数的形象图 7 K 。 这就是累计频数分 i ；j ( camulative frequency diseribu - 

tion ) 0 


累计频数分布建立的基础是相同数据的频数分布，但是多增加了一列 
(累计频数），如下表所示。 


组距 

频数 

累计频数 

45 -49 

i 

50 

40 -44 

2 

49 

35-39 

4 

47 

30 -34 

8 

43 

25 -29 

10 

35 . 

20〜24 

10 

25 

15-19 

8 

15 

10〜14 

4 

7 

5 

2 

3 

0 ~ 4 

1 

I 


累计频数分布的开始是建立标签为累计频数的新的一列。接着将 一 
个组距的频数和其下的所有频数加起来。例如，0〜4组距的发生频数是 
1，在这一组之下没有其它组距，因此累计频数是1。对于5 组距来说， 
这一组的发生频数是2,这一组之下的发生频数是1，因此这一组或这一组 
之下的总的频数是 3(1 +2)。最后的组距 （45 〜 49) 发生频数是1,因此这 
一组或这一组之下的总的频数是50。 

—旦我们建立了累计频数分布，那么数据就可以用图表示为直方图或 
频数多边形图。只有这一次我们跳过了一些内容，并且绘制每一个组距的 
组中值作为这个组距的累计频数。你可以在图 4. 5看到以这一章幵始提 
供的50个数值为基础建立的累计频数分布。 
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组距 


图 4. 5手绘累计频数分布 




累计频数多边形图的另一个名称是肩形图 （ ogive )。 而且，如果 
数据是正态分布（见第7章更多的内容），肩形图呈现出的就是更为 
大家 r 解的钟形曲线或正态分布。 spss 可以建立很好的肩形 

图-也称作 p - p 图（用于概率图），而 [1 很容易建立。阅读附录 a 

关于使用 SPSS 建立图表的介绍，而旦阅读本章接下來所有的内容。 


扁平和细长的频数分布 

现在你对以一定程度地推断数据分布相互之间在许多方面非常的不 
同。实际上，在四个方面 不同： 平均值、变异性、偏度（也叫倾斜度——译 
者注）和峰度。后面的两项是新的概念，我们会在图形展示这两项时再进 
行定义。现在依次定义这四项特征值，并 i : L 用图形说明。 
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平均值 

我们再次回顾集中趋势量数。如图 4. 6所承，你会看到三个不同的数 
据分布的平均值的差异程度。你会看到数据分布 C 的平均值大于分布 B 
的平均值，相应的分布 B 的平均值大于分布 A 的平均值。 



支异蚀 

在图 4. 7中你可以看到具有相同平均值但是变异性不同的三个数据 
分布。数据分布 A 的变异性小于数据分布 B 的变异性，相应的分布 B 的 
变异性小于分布 C 的变异性。换句话说就是三个数据分布中分布 C 的变 
异性最大，分布 A 的变异性最小。 



图 4. 7数据分布的变异性差异程度 


偏皮 

偏度 （ skewness ) 是对数据分布对称性缺失或者分布不平衡的测量。 
换句话说就是分布的一个“尾巴”比另一个长。例如在图 4. 8中，数据分 
布 A 的右侧尾比左侧尾长，相应的就是分布的大数值一端的发生次数较 
小。这是正偏度分布。这个案例就是这种情况 ：当你 参加一次难度非常大 
的考试，只有少数学生取得相当高的成绩，而大多数学生的成绩相当低。 
分布 C 的右侧尾比左侧尾短，相应的就是分布的大数值一端的发生次数 
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较大。这是负偏度分布，难度较小的考试就是这种情况（大多数是高分， 
相应的少数是低分）。分布 B 刚好左右尾相等，而且没有偏度。如果均值 
大于中位数,就是正偏度分布。如果中位数大于均值，就是负偏度分布。 

分布 B 
无偏度 


毅 


最小值 最大值 

图 4.8 不同分布的偏度 

峰皮 

虽然这个词听起来像医疗情况，但迭是我们区分数据分布相互 区别程 
度的四个方面的最后一个。峰度 （ kurtosis ) 与数据分布看起来是扁平或者陡 
峭有关，而且用于描述这个特征的概念是相对的。例如，低阔峰 
( piatykurtic ) —词是指数据分布相对于正态分布或钟形分布来说十分的扁 
平。高狭峰 ( leptokurtic ) —词是指数据分布相对于正态分布或钟形分布来 
说十分的陡峭。在图 4.9 中，数据分布 A 与分布 B 相比是扁平的。数据分 
布 C 与分布 B 相比是陡峭的。图 4.9 看起来与图 4 _7类似，这是由于一个很 
好的原因——例如低阔峰数据分布比不是低阔峰的数据分布更分散。类似 
地，陡峭峰数据分布相对于其他分布来说离散性或变异性更小。 


I 


最小值 最大值 

图 4.9 不同分布的峰度 
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现在偏度和峰度是常用的描述用语（例如，“这是负偏度分 
佰”），有一些数学指标测定分布的倾斜或陡峭的程度。 例如，偏度 
是通过均值减去中位数计算。例如数据分布的均值是100而中位 
数是 95 , 偏度值是 1 ( 10-95 = 5 , 而且这个数据分布是正偏度 分布。 
如果数据分布均值是 85 而中位数是 90 , 偏度值是 85 - 90 = - 5 , 这 
个数据分布是负偏度分布。其实还符更髮杂的公式，这个公式不 

是相对的，不过因为考虑了数据分布的标准差，所以偏度指标能够 
相互比较（见公式 4. 丨）。 


SK — 


3(^r - m ) 


( 4 . 1 ) 


其中 

SK 是皮尔逊（他也计算相关系数，你会在第 5 章了解他）偏度 

量数 

Z 是均值 
^是中位数 

使用这个公式我们能够在绝对意义上而不是相对意义上比较 
不 M 数据分布的偏度。例如数据分布；的均值是 loo, 中位数是 
105, 标准差是 10 。 数据分布 F 的均值是 120, 中位数是 U6, 标准 
差是10。使用皮尔逊的公式，分: V 尤的偏度是-1.5,分布 K 的偏 

度是 I . 2 。分布尤是负偏度，分布 K 是正偏度。不管偏度的方向如 
何，分布1比分布 y 更倾斜。 


其他的图表数据的绝妙方法 

到现在为止本章我们所做的就是给出一狴数据，然后说明如何使用图 
表如直方图和多边形图来形象地表示数据 D 但是在行为和社会科学领域 
还使用一呰其他类型的图表，虽然对你来说没必要确切地知道如何建立这 
些图表（手动绘制），但是你至少应该熟悉它们的么称和 应用。 因此下面 
介绍这些流行的图表，如何应用以及如何实现它们。 

这驭布许多建立图表的很好的个人电脑软件，其中就有 Excel 电子数 

据表（微软产品），当然还有 SPSS 。 作为参考，图 4 , 10 ,图 4. 11与图 4. 12 

是应用 Excel 建立的图表 3 “使用计算机图示数据”部分的围表是使用 
SPSS 建立的。 


牲形图 


如果你想比较不同分类之间的频数就应该用柱形图。分类项在水平轴 
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%轴上显示，数值在垂直轴; r 轴上显示。下面的例子你可能想要使用柱 
形图： 

• 不同政党背景的投票人数 
• 不同产品的销售量 
• 六个不同年级的学生人数 
图 4. 10表示不同政党背景的投票人数。 



共和党 民主党 无党派 

图 4. 10比较不同分类的柱形图 


条形图 

条形图和柱形图一样，但是在这个条形图中，分类项在垂直轴7轴上 
显示，数值在水平轴$轴上显示。 

成 固 

当你想用相同的间距表示数据的趋势，就用线图。下面的例子你可能 
想要使用线图： 

• 三个州立大学的大学生中每季出现单核白血球增多症病案的数量 
• 每学年入学人数的变化 
• 两个航线每季的旅行人数 

在图 4. 11中你可以看到三个州立大学的大学生中每季报的单核白 
血球增多症病案的数量的线图。 

30 1 - 

Padukah State 
… ，一 . Slate 



Winter Spring Suimner Fall 

季节 

图 4.11 使用线图表明数据随时间发展的趋势 
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饼囝 

如果你想表示组成一系列数据点的项目的比例， " J 以使用饼图。下面 
的例子你可能想要使用 饼图： 

• 生活贫困的儿童中各种族的比例 

• 注册夜间部和日间部的学生的比例 

• 不同性别的参与者的年龄分布 

存:择] 4. 〖2,你可以看到不同种族的生活贫困的儿童的数尬的饼图 


黑人25% 


图 4. 12说明不同分类项的相对比例的饼图 

使用计算机图示数据 




现在我们使用 SPSS ， 并逐步建立本章讨论的一些 图表： 首先 
了解 SPSS 图表建立的一般规则。 

1 .耍建立降 I 表，你亩先隶入想要图乐说明的数据，接着从 
Graphs 菜单选择你想建立的图表类型（看，我已经告诉你在不同的 
设置中它们的称谓不同）。 SPSS 把数据的形象表汞叫做 gmphs 。 

2■编辑图表，双击图表本身就会打开图表编辑器 （Chart Edi _ 
tor ) 0 编辑图表直到你看着适合。 

3-返回最初的图表，点上窗 n 左上角的图标关闭图表编辑器。 


建立直方图 



1 — 录人阼 想用于建立图表的数据。在这个案例中，我们使用 
建立本章开始所示的直方图所用 的相同 数据。 

2— 点击 Graphs ^ Histngram , 你就会看到如下所示的直方图对 
话框 D 
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i Histogiam #1 


^ =4- i i J 


彩 score 


共和党 （ Republican) 民主党 （ Democrat) 无党派 （ Independent) 


依据下面的步骤建立条形图。输人你想用于建立图表的数据。这是 
我们要用的 数据： 


图4/14使用 SPSS 建立直方图 


Std.Dev= 10.01 
Mean ;23.6 
N 二 50.00 


_方图和本章之前所示的 51 
年之处在于 SPSS 是用自身独特的方法定义组距 & SPSS 将 


%, 


:_差异之处在于搬 


组距的最紐作雜距財細如絲中值 （例 

.. > . W. 




建立条形图 


4 一点击 OK , 就输出如下所示直方图。 


: 


•f 


M 


%i：m 


图 4. 13直方图对话框 

3 — 双击变量 score 将变量移到 Variable 框。 


■1 J 


k 「 




D*"' 




㈣ 


f 綱 I 






> 




:: v * :; 






0.0 5.0 10.0 15.0 20.0 25.0 30.0 35.0 40.0 45 .(： 
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1 一 点击 Graphs — Bar ， 你就会看到条形图对话框。 

2 —点击 Summaries for groups of cases , 接着点击 Define , 你就会看到 


图<15所示的对话框。 




4. 15 


条形图对话框 


3 — 点击 Other summary function 。 

4— 点击变量 number ， 接着点击►将变量移到 Variable 框。 

5 点击变量 party ，接着点击►将变童体到 ： Category Axis 框。 


6—点击 0 K , 就输出如下所示条形图。 



Repu blican Demoe mt 


lndej>enidenl 


图 4.16 使用 SPSS 建立条形图{类似于柱形图) 
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建立线图 



按照如下的步骤建立 线图: 

i 一录入你想用于建立线图的数据。在这个案例中，我们使用三个 
大学的大学生汇报的单核白血球增多症病案的数量。这就是 
数据： 


Padukah state 

Williams state 

Party U 

59 

72 

23 


2 — 点击 Graphs — ► Une , 你就会看到线图对话框。 




3— 点击 Simple * 接着点击 Summaries for groups of cases G 

4 — 点 it 」 丨 > efine ，你就会看到如下所示的 Deifine Simple l ine ： Sum 


maries for Groups of Cases 又于话框 0 













- 




mm 


Hi : 






nisi 




: r 薄 .^ __ 

為励「:：:巧 

- 






卜 .1 




wm 




- i 4 I 

'I I 


華 













图 4.17 定义简单线图对话框 

5— 点击变量 Cases , 接着点击 Other summary function ，然后点击 
将变量移到 Variable 框。 

6— 接着将变量 inst 移到 Category Axis 框。 

7 一 点击 OK , 就输出如下所示线图。 
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爱上统计学 



图 4+18 三个大学单核白血球增多症病案数置的线图 


建立饼图 



按照如下步骤建立饼图。 

1 一录人你想用于建立饼图的数据。在这个案例中，饼图用于表示 


不同种族的生活在贫困状态的儿童的数量。这就是 数据: 


种族 

比例 

白人 （ White ) 

61 

黑人 （ Black ) 

25 

其他 （ Other ) 

14 


2— 点击 Graphs-^Pie, 你就会看到饼图对话框。 

3— 点击 Values of I ^ idividua ! cases 0 

4 — 点击 Define 0 你就会看到 Define Pie : Values of individual cases 对* 

话框。 . 

5 — 点击变量 pemem ，接着点击►将变量移到 Slices Represent 变 
量框。 

6一点击变 hi : Ethnicity ，接着点击►将变量移到 Slices Labels 框。 

7 —点击 OK , 就输出如下所示饼图。 
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图 4. 19 饼图 一 表示几个变釁想对于总体的发生比的非常好的方法 

―― i WM——M i HHHHMi 8—i—I 


小结 

毫无疑问建立图表很有趣，而且能极大地增加对没有整理的数据的理解。 
依据我们在本章给出的建议可以很好地使用图表，不仅会而且已经加强了对数 
据的理解。 


练习时间 

1.50 个阅读理解考试成缋 （ 变量名 com P _ S c ) 构成的名称为第4 章数据集 i 
(Chapter 4 Data Set 1 ) 的数据集可以在网上获得。回答下面的问题或完成下面 
的任务： ' 

a . 建立这个数据集的频数分布和直方图。 ‘ 

b . 为什么选择你所用的组距？ 

c . 这是有偏度分布吗？你如何知 道的？ 

2. 针对下面的每一种情况，说明你是使用饼图、线图还是条形图？为什么。 

a . 某个大学的一年级 、二 年级、三年级和四年级学生的比例 

b . 四个学期的平均成绩 （ GPA ) 的变化 

c . 申请四个不同职位的人数 ’ 

d . 对不同刺激的反应时间 

e . 10个项目中每一项的得分 

3. 去图书馆找一篇你感兴趣的领域的期刊文章，文章包含经验数据但是没 
有对数据的图形表示。使用这些数据建立图表。要确定你要建立哪一类型的图 
表，以及为什么做出这样的选择。你可以手绘图表，或者使用 SPSS . Excel 建立 
图表。 

4. 建立你能够建立的看起来最坏的图表，如表格拥挤和文字无用。没有什 
么东西能像糟糕的案例一样令人印象深刻 了。， 

练习参考答案 

1 a . 这就是频数分布表。 
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组距 

频数 

45-49 

1 

40 -44 

2 

35〜39 

3 

30〜34 

8 

25 ^29 

10 f 

20〜24 

10 

15-19 

8 

10 - 14 

4 

5-9 

2 

0 "*4 

2 


直方图（用 SPSS 完成）应该是 这样: 


12 

10 

8 

6 

4 

2 

0 

00 10.0 2(X0 30.0 40,0 50.0 60.0 



5-0 15.0 25,0 35.0 45.0 55.0 


StcL Dev=I6.99 

Mf?an=34.4 

N=50.00 




4.20 


第 4 章数据集！的直方图 


lb . 我们以组距5建立直方图，这样我们就有10个组距，而且也符合我们本 
章讨论的决定组距的标准。 

lc . 分布是负偏度分布，因为均值小于中位数。 


2 a . 饼图 
2 b . 线图 


2 c * 条形图 
2 d , 线图 


2 e , 条形图 
3•自己来完成^ 

4,我们使用 SPSS 和图表编辑器完成了这个图一一既难看又没什么信息 
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o . ol ~I 


5,0 


叫 [4 

15-0 I 

‘ ' k 


叫 3 

30-0 ； _|3 | 

35_0 |3 

40,0- 4 


獅 — 

45+0 ， 

50.0 二 

55.0 I 

600 F 


1« 




i h £ike a look at this! 


Std + Dev= 16.99 
】 0 Mean=34.4 

N=50.00 


Number 


图 4.21 真是非常难看的图 
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冰淇淋和犯罪 




•什么是相关系数，相关系数如何应用 
•如何计算简单的相关系数 
• 如何解释相关系数的值 
• 其他类型的相关系数 


相关系数到底是什么 

伞 

集中趋势 M 数和变异性 M 数不是我们最看好的用于描述数据集看起 
来是什么的唯一的描述统计。你已经了解，知道了最具代表性的统计值 
(集中趋势）和散布或离散性（变异性）董数的值是描述数据分布特征的 
关键。 : 

但是，我们有时对变量之间的关系感兴趣。或者更精确地说，当一个 

变 M 发生变化时，另一个变量如何变化。我们的这种兴趣表现在计算简单 
相关系数上。 

相关系数 （correlation coefficient ) 是反映两个变董之间线性关系的数 
值性指标。这个描述统计值的值域范围是 -1 到1。两个变量的相关有时 
也叫做二元相关。本章大部分讨论的相关类型是皮尔逊积距相关 （ P ear - 
soii product-momentcorrelation ) ，是以它的发明者卡尔.皮尔逊命名的。 



皮尔逊相关系数考察两个变量之间的关系，但是这搜变量的 
属性是连续的。换句话说，这些变量可能是某些基本的连续体中 
的任何值，例如体重、年龄、考试成绩或收入。但是大多数其他变 
量是不连续的。这些变量叫做离散变量或者类别变量，例如种族 
(如白人和黑人）、社会阶级（如高和低）和政党背景（如民主党和 
典和党）。你需要使用其他相关技术，如这些情况下要用的点二列 
相关。这些内容需要更高级的课程，但是你应该知道这些技术非 
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常有用，也令人满意。我们在本章后面的部分还会对这些技术进 
行简短讨论。 

还有其他类型的相关系数用于测 M 两个以上变量之间的关系，而 a 我 
们会把这些内容留到下一个统计课程（你现在已经期望这样的课程了， 
对吧？）。 

相共糸教的真型 ：选择 1 和逸择 2 

相关反映变健间关系的动态性质。这样做可以让我们理解变量发生 
变化的变化的方向是相同还是相反的。如果变 M 变化方向相同，相关是直 
接相关或 iK 相关 （（lirecl correlation . 或 positive correlation ) 0 如果变 M 变化 
方向相反，相关是间接相关或负相关 （indirect correlation 或 negative correla ¬ 
tion ) 0 表 5. 1 给出这些关系的汇总。 


表 I 相关关系的类型和相应的变董之间的关系 


变量 X 

的变化 

变置 y 

的变化 

相关关系的 

类型 

数值 

例子 

义值增大 

y 值增大 

直接的或正向的 

正值， (.00,1.00) 

你用于学习的时间越多，考 

试成绩就会越高。 

X 值降低 

y 值降低 

直接的或正向的 

正值丄00，1_00) 

你在银行存的钱越少，所得 

X 值增大 

^值降低 

间接的或负向的 

负值，（ - L 00，.00) 

利息就越少 P 

你运动越多，体重就越轻。 

X 值降低 

y 值增大 

间接的或负向的 

负值，（ -1,00,.00) 

你完成考试的时间越少，所 

犯的错误越多。 


现在要记住表中的例子反映的是通则。例如，考虑一次考试中完成试 
卷的时间和答对的题 fc ! 的数量： 一 般来说 ，一 次考试所用的时间越少成绩 
越低。 

这样的结论不是火箭科学，因为回答得越快越可能犯无意识的错误, 
例如没有正确地阅读指导语。当然也有人既能答得快又能回答得很好。 
而且也有人虽然答得很慢但是却不能回答得很好。重要的是，我们讨论一 
个群体在两个变量上的表现，是计算一个群体的两个变量之间的相关，而 
不是对应任何一个特定的个人。 


需要记忆的内容 



送里有许多与相关系数相关的容易而重要的内容。 

• 相关系数的值域范围是（ -1,1) 

•相关系数的绝对值反映相关的强度。因此，相关系数 -0.70 比 
相关系数 0.50 表示的相关强度大。在考虑相关系数时，学生们 
常犯的一个错误是，只是因为符号的原因时认为直接的或正相 
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关总是比间接的或负相关强（例如“更好” ） 。 

• 相关总是反映每个案例至少有两个数据点（或变量）的状况。 

• 另一个易犯的错误是依据相关符号进行价值判断。许多学生认 
为负相关不好而正相关很好。如果他们仅仅从字面上理解，就 
会犯下“正相关”总是比“负相关”更强更好的错误。 

• 皮尔逊积巨相关系数用小写字母 r 表示， r 的下标表示相关的两 
个变量。例如， 

是变量 X 和变量 Y 之间的相关系数。 
r — ight 是身高和体東之间的相关系数。 

是学术能力测验成绩 （ SAT ) 和平均成绩 （ GPA ) 之间的相关 
系数。 



相关系数反映两个变量共同变化的程度。例如，你可以预期 
—个人的身髙和他的体重相关，因为他们共享许多特征，如个人的 
营养和医疗史、总的健康状况和基因。但是，如果一个变量值不发 
生变化，那么就不存在什么共同的变异性，也就是两个变遺之间的 
相关系数为0。例如，你计算年龄和完成的就学年限之间的相关， 
而每个人的年龄是25岁，那么这两个变鐘之间不相关，因为就学 
年限和年龄之间完全没有一起变化的部分（任何的变异性）。 

同样的，如果限制或者控制一个变量的值域范围，这个变量和 
其他变 M 之间的相关系数相对于变置的值没有限制的情况来说会 
更小。例如你计算成绩非常好的学生的阅读理解成绩和年级之间 
的相关，你会发现相关系数小于你从全体学生计算得到的同 一 相 
关系数。这是因为成绩常好的学生的阅读理解成绩也非常好， 
相对于所有的学生来说这个成绩的变化很小。那么应该怎样避免 
这种情况？如果你对两个变虽之间的关系感兴趣，就尽力收集充 
分的离散数据 一^ ■这样你才可以得到最具代表性的结果。 


计算简单相关系数 


公式 5. 1所示是变 置1 与变量 F 之间的简单皮尔逊积矩相关系数的 
计算 公式： 


其中 







ra I x 2 - ( x ) 2 n ^ f 3 - ( y y ) 2 



~ 是 x 与 y 之间的相关系数 
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rz 是样本规模 

I 是变量 A ： 的具体数值 

K 是变 M F 的具体数值 

灯是每一个尤值与相应的^值的乘积 

X 2 是 I 值的平方 

y 2 是 k 值的平方 

这是案例中使用的 数据： 


2 

4 

5 

6 

4 

7 

8 

5 

6 
7 

总计、合计或 Z 54 


4 

9 

6 

16 

4 

8 

25 

36 

30 

36 

25 

30 

16 

9 

12 

49 

36 

42 

64 

25 

40 

25 

16 

20 

36 

16 

24 

49 

25 

35 

320 

201 

247 


在将数据代人公式之前，我们要确信你理解了每一符号代表的含义。 
Z 义或; T 值的总和是54。 

X F 或 y 值的总和是43。 

工妒是每一个尤值的平方的总和，是320。 -. 

X f 是每一个 y 值的平方的总和，是201。 


是尤和 f 的乘积的总和，是 247 





按照下面的步骤计算相关 系数： 

1 一列出每个参与者的两个数值。你应该以列的形式列出以避免 
混清。 

2— 计算所有1值的总和，并计算所有 y 值的总和。 

3— 计算每个 X 值的平方，并计算每个1"值的平方。 

4— — i 十算1 jYY 的总和 o 
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将这些值代人公式 5. 2的等 式中: 


(10 x 247) - (54 x 43) 

VT ( 10 X 320 ) - 54 2 ] [ ( 10 x 20 1) ^43 2 ] 


对啦，你会在公式 3. 3中看到 答案： 

148 

rxf ^2\3~%3 


692 


(5,2) 


(5,3) 

ih 


相共的图示 表达： 散点图 

~ ■种非 常简单、直观的表不相关的方式是建立所谓的散点罔 （ scatter - 
plot ) ，或散布图 （ scaUefgram 〉。 这是数据集在坐标轴分布形成的简单 
图示。 

我们依据下面的步骤建立已经计算了相关系数的10对数值的散布 
图，如图 5.1 所示。 



X 


图 5.1 


简单的散点 




1_幽 出尤轴 fu y 轴。一般来说，变量 x 在横轴，变量 r 在纵轴。 

2— 依据你知道的数据标出数轴的值域范围。例如，在我们的案例 
中变量尤的值域范围是2 〜 8，因此我们在 X 轴标出的值域范围 
是0 -9 0 值域范围标注的高一些或低一些没有影响-—只要 
你留出数值能出现的空间。变量 K 的值域范围是2 〜 6,因此我 
们在^轴标出的值域范围是0 〜 9。制作相似标签的数轴有时 
能够使得完成的散点图更容易理解。 

3— 最后，对应每对数值（例如图 5. i 中所示的2和 3) 我们在图中 
标注一点，标注的地方是 2 对应 A ： 轴3对应 K 轴。就如在图 
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5. 1中所看到的，点代表数据点 （data point ) ，是两个值的交 
叉点 o 

m 

绘出了所有的数据点之后，我们所做的这个图就能告诉我们两个变量 
之间的关系。首先，数据点集合的形状表明了相关是正向的还是负向的。 

如果一组数据点形成的点集是从 I 轴和^轴的左下角到右上角，就 
会出现正向的斜率。如果一组数据点形成的点集是从 X 轴和 F 轴的左上 
角到右下角，就会出现负向的斜率。 

还有一些散点图表现出非常不同的相关，你能看到一组数据点如何反 
映相关系数的强度和方向。 



2 3 4 5 6 789 10 

X 


图5,2完全的正相关 

图 5.2 所示是完全 W 相关，化 = K 00,而且所有的数据点排成一条正 
向斜率的直线。 

如果是完全负相关，相关系数值就是 -1.00, 而且数据点也会排成一 
条直线，但是直线是从图的左上角到右下角。换句话说，连接数据点的直 
线的斜率是负向的。 



S' ； - 

b 这些不 
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图 5. 3中你看到的是正向强相关的散点图，但不是完全相关，相关系 

数~ =.70。要注意的是数据点沿着正向的斜率排列，虽然不是完全 
相关。 



0 1 2 3 4 5 6 7 S 9 ID 

X 


图 5.3 正向的强相关，但不是完全相关 

现在我们向你展示负向的强相关，如图 5.4 所示的相关关系，相关系 

数 〜=- .82。要注意的是，数据点如何沿着负向的斜率从左上角向右下 
角排列。 



图 3.4 负向的强相关关系 



5 冰淇淋和犯罪-—计算相关系数 


63 


这就是不同的相关类型看起来的样子，而且你可以依据数据点组合的 
方式大致判断相关的一般强度和方向。 



不是所有的相关都是用直线表明 X 值和 F 值关系的线性相关 
(linear correlation ) 0 相关关系能不是线性的，而且也可能不是 
由直线反映的。就如年龄和记忆力之间的相关。在少年时期，相 
关可能是很强的;11:相关——儿童的年龄越大，他们的记忆力越好。 
接着，到了青年和屮年时期，没有太多的变化或相关程度变化不 
大，因为大多数青年人和中年人保持了良好的记忆力。但是在老 
年时期，记忆开始消退，而且在老年时期记忆力和年龄的增长是负 
相关关系。如果你将这些集中起来考虑，你会发现记忆力和年龄 
之间的相关看起来像曲线，也就是记忆力增长，保持一定水平，接 
着就下降。这是曲线相关，而且有时对这样的关系的最好的描述 
就是曲线。 ' 


相共 集：相 共矩眸 

如杲你有两个以上的变量怎么办？如何说明相关？如下所示的相关 
矩阵是非常简单和有效的解决方法。 



收人 

教育 

态度 

选举 

收入 

1-00 

. 574 

-.08 

-.291 

教育 

,574 

1.00 

-•149 

-•199 

态度 

-*08 

-,149 

1,00 

-*169 

选举 

-.291 

-■199 

-,169 

1*00 


就如你看到的，矩阵中有四个变量：收人水平 （income ) 、教育水平 
( Educ ) 、选举态度 （ Attitude ) 以及最近的选举中个人是否参加了选举 

( Vote ) 。 

对应每 一 对变量都有一个相关系数。例如收人水平和教育之间的相 
关系数是.574。类似的，收人水平和这个人是否参加最近的选举的相关系 
数是 - .291( 意思是说收入水平越高，这个人越可能不参加选举）。 

在这样的矩阵中，总是有4! /(4-2)! 2!个相关系数,也就是说在4 
个变量中一次选择2个总共会有6个相关系数。因为变 M 和他们自身完 
全相关（也就是沿着对角线的值都是 1.00) ，而且因为收人和选举之间的 
相关系数与选举和收入之间的相关系数相同，矩阵建立了自身的镜像。 
你在阅读应用相关描述儿个变量之间的关系的文章时就会看到很多 

这样的矩阵。 




万卷古法 



爱上统计学 


理解相关系数的含义 

现在我们已经有/变量间关系的数值指标，而且我们知道相关系数的 

值越大（不论 ili 负号），相关关系就越强。但是因为相关系数值不是和结 

果值直接关联,那么我们如何解释相关系数值,并使之成为更有意义的关 
系指标？ 

有几种方式可以来理解简单相关系数 b ,。 

使用不成文的规则 

也许最容易的 （ 但不是信息童最高的 ） 解释相关系数值的方式是看看 
相关系数的大小并使用表 5. 2中的信息。 

表 5. 2解释相关系数 

相关系数的大小 一般解释 

~ " 非常强的相关 

强相关 

• 4 ~* 6 中度相关 

■2-. 4 弱相关 

U _ 弱相关或无关 

因此，如果两个变量之间的相关系数是 .5, 你可以肯定地得出结论，变 

量间的关系是中度相关-不是强相关，也肯定不是讨论的变量没哲任何 

共同特征的弱相关。 

这种浏览式方法非常适合快速的评价两个变童之间关系的强度，就如 

研究报 W 中的描述部分。但是，因为不成文的规则确实依赖主观判断（什 

么是“强相关”或“弱相关”），我们应该选择更精确的方法。这就是我们将 
要看到的内容。 

决定性的 努力： 相关系数平方 

更精确的解释相关系数的方法是计算决定系数。决定系数 （ Coe ffi - 
cient of tlelermination ) 是一个变量的方差可以被另一个变貴的方差解释的 
百分比。是不是太难了？ 

在本章前面的部分我们已经指出共享某些特征的变壁之间如何相关。 
如果我们计算100个五年级学生的数学成绩和英语成绩的相关关系，我们 
会发现是中度相关，因为数学好 （ 或不好）的孩子的许多原因也是他们英 
语好（或不好）的原因。他们学习的时间、聪明的程度、他们的父母关注他 
们的学习成绩的程度、家里图书的数蛰以及更多的方面都和数学及英语成 
绩有关， i 〖 u 且可以解释这些孩子的不同（这也是变异性的来源 ） 。 
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这两个变显共享的特征越多，他们就越相关。这两个变董也共享变异 
性—— ■或 者孩子们之间存在差别的原因。总之，学习越努力、越聪明的孩 


子成绩越好。 

决定系数的计算是为了确定-个变 M 的方差可以被另一个变董的方 

差解释的程度，决定系数就是相关系数的平方。 

例如，如果平均成绩和学习时间之间的相关系数是 . 70 ( 或者= 

.70)，那么决定系数——由表示，是刀 2 或.49。这意味着平均成绩方 
差的49%可以被学习时间的方差解释。相关越强，越多的方差可以被解释 
( 这很有道理）。这两个变量共享的特征越多 （ 例如好的学习习惯、课堂能够 
学到的知识、没有压力） ，一 个变 置可以 更多地解释另一个变 M 表示出的 


信息。 

但是，如果49%的方差可以被解释，就意味着51%不能被解释-因 

此即使 对相关系数是 . 70 的强相关来说，也存在很多无法解释的原因导致 
变置间的变化差异。不能解释的方差的数值就是不相关系数（也叫做非 


决定系 数〉。 这仅仅是不能被 X 解释的 Y 的方差的数 

如何形象地表示共享方差的想法？你会在图 5. 5中看到一个相关系 
数、对应的决定系数，以及表示两个变盘共享的方差多少的图。每个图中 
灰色区域越大 （ 两个变 M 共:享 的方差越大），送两个变量就越相关。 


相关系数 

r XY = 0 



r XY = ^ 9 


决定 系数# 

变量 I 变量 F 

= 0 

(^) 共享 0% 

= ,25 或 25% 


r^ T = * 81 或 81% 

1 ( Q ) 共享 _ 


图 5.5 变量如何共享方差以及相应的相关 


• 第一个图中两个圆没有接触。他们没有接触是因为他们没有任何 
共享的部分。相关系数为0。 

• 第二个图中两个圆有重叠。相关系数是 .5( 而 M r 2 n = .25) ，两个变 
量共享25 %的方差。 

•最后，第三个图中的两个圆几乎是一个置于另一个之几乎是完 
全相关，相关系数^ = .9(4 = ,81) ，两个变量共享81%的方差。 


冰淇淋吃得越多……犯罪牟訧越高 ( 兵联与因果共糸） 

这足计算、理解和解释相关系数时需要注意的真正重要的事。在美国 


( 原文是非决定系数——译者注) 
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一个中西部的小镇，人们发现了一个不符合逻辑的现象。地方警察局局长 

发现冰淇淋消费量越多，犯罪率就越高。这很简单，如果你测量这两个变 

量，你会发现这两个变量的相关关系是正向的，也就是人们吃的冰淇淋越 

多，犯罪率就越高。就像你可能预期的一样，他们吃的冰淇淋越少，犯罪率 

就越低。这个警察局长很是困扰，直到他回想起他在大学选修的统计学 
课程。 

他的这个困惑最后怎么变成了一个“哈哈”！他想这“非常容易”。这 
两个变 M —定是共享什么或彼此之间有点共同之处。要记住，一定存在什 
么变量同时和冰淇淋消费水平和犯罪率水平相关。你能猜到是什么？ 

室外温度是他们共有的特征。当室外气温变暖，如在夏天，就会有更 
多犯罪 （ 卩 I 天更长，人们多开窗户，等等）。而因为天气变暖，人们更享受 

吃冰淇淋的乐趣。相对地，在又长又黑暗的冬天岁月，冰淇淋的消费就减 
少，同时犯罪也越少。 

乔 • 鲍勃 （Joe Bob ) 近来被选举为城市议员，他知道了这些发现并且 
有了一个很好的想法，或者至少他认为他的选民会喜欢这个想法（记住， 
他忽略 r 大学开设的统计学课程）。为什么不在夏天这儿个月限制冰淇 
淋的消费量，以便使犯罪率下降？听起来很合理，对吧？得啦，不用进一步 
检验就能知道，这个结论根本没有意义。 

这里有一个简单的原则，那就是相关表示两个或更多变量之间存在关 
联；相关和因果关系无关。换句话说，仅仅因为冰淇淋消费水平和犯罪率 

一起增长（或一起下降）并不意味着^—个变量的变化会导致另一个变璧的 

变化。 

例如，如果我们将镇子里所有商店的冰淇淋拿走而且不再能得到，你 
认为犯罪率会下降吗？当然不会，连这样想都是十分荒谬的。但是十分奇 
怪的是相关经常这样被解释 ^ 一就好 像真的存在因 果关系 ——而社会科 
学和行为科学的复杂问题就会因为误解沦落为微不 足道的 琐事。长头发 
和嬉皮士和越南战争有关吗？当然不是。犯罪数量的上升和更有效、更安 

全的轿车有关吗？当然 不是。 但是他们都是同时发生，而且建立了关联的 
假象。 

其他重要的相关 

评价变 M 的方式很多。例如定类变量的属性是类别的，如种族（白人 
或黑人）或政党背景（无党派或共和党）。或者你测量收入和年龄，两者都 
是定距水 f 的变量 ，因为作为它们建立基础的连续体具有相等的间距。当 
你继续研究，你可能遇到发生在不同测量水平之间的数据的相关。而要计 
算这样的相关你需要一些特殊的技术。表 5. 3汇总了这些不同的技术以 
及他们如何相互区别^ 
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表 5- 3 


相关系数展示，选哪一个? 




变量 X 

变量 F 

相关类型 

要计算的相关 

定类的 （ 选举偏好，如共 
和党或民 主党） 

定类的（性别，如男 
性或女性） 

卡方系数 

选举偏好和性别之 
间的相关 

定类的（社会阶层.如！二 
层、中层或下层） 

定序的（高中毕业班 
的排序） 

等级二列相关系数 

社会阶级和在高中学 
校排序之间的相关 

定类的（家庭结构，如双 
亲家庭或单亲家庭） 

定距的（平均成绩） 

点二列相关系数 

家庭结构和平均成 
绩之间的相关 

定序的（转换为排序的 

定序的（转化为排序 

斯皮尔曼等级相关 

身髙和体重之间的 

身高） 

的体重） 

系数 

相关 

定距的（解决的问题数 

量） 

定距的（以年计的 

年龄） 

皮尔逊相关系数 

解决的问题数量和 
以年计的年龄之间 

的相关 


使用计算机计算相关系数 

现在我们使用 SPSS 计算相关系数。我们使用的数据集是名 
称为第5章数据集1 ( Chapter 5 Data Set 1 ) 的 SPSS 数据集文件。 

这个数据集中有两个 变量： 


变童 

定义 


收入 （ income ) 

以千计的年收人 


教育 （ educ ) 

以年计的教育水平 




依据下面的步骤计算皮尔逊相关系数： * 

1. 打开名称为第5章数据集 1( Chapter 5 Data Set 1 ) 的文件 0 
2 * 点山 Analyze — > Correlate — Bivariate ，你就会看到图 5 .6 中所 
示的 Bivariate : Correlations 对话框。 

3. 双击变量 income 将变量移到 Variables 框。 

4. 双击变量 educ 将变量移到 Variables 框。 

5. 点击 0 K 。 







— 










SPSS 徐出结果 


图5, 7中的输出结果显示相关系数等于 • 574。也表明样本规 

模是20 ， 以 及相关系数的统计显蒈性测■指标 （我们 会在第13章 
讨论） 0 


图 5. 7相关系数计算的 SPSS 输出结果 
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40 000 

30 000 



图 5.9 简单的散点图 



20 000 


50 000 


60 000 


70 000 


8() 000 


图 5.8 使用 SPSS 建立简单的散点图 

3. 点击变 M income ， 接着点山►将变 M 移到 Y Axis 

4. 点击变量 educ ， 接着点击►将变量移到 X Axis 相 

5. 点击 OK ， 你会看到图 5_9 中所示的散点图。 




2. 点击 Simple , 接着点击 Define ，你会看到图 5* 8中的 Si 
Scatterplot 对活框。 , 



入以 。: i 
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^ 万 卷方汸 


爱上统计学 



小结 


表明一个变量和另一个变量如何相关以及他们共有什么特征的想法是非常 
有影响的想法，也是非常有用的描 述统计 (也在推论统计中使 用）。 要记住 的是， 
相关表明的关系仅仅是关联的，但不是因果的。如果你能够理解这项统计如何 
就变量间的关系给我们提供了有意义的信息，以及一个变量在另—个变量变化 
时如何变化或保持不变，那么现在是时候开始学习第 n [部分 * ，也就是包括概率 
和假设检验在内的推论统计的概念基础。 


练习时间 

1 ■使用 这些数据回答问题 la 和 lb 。 这些数据的数据集名称为第5章数据 
集2 ( Chpater 5 Data Set 2 ) 。 


(20 个问题之中）回答正确的总数 

对考试的态度（总分是 100) 

17 

94 

13 

73 

12 

59 

15 

80 

16 

93 

14 

85 

16 

66 

16 

79 

18 

77 

19 

91 

a * 手动计算皮尔逊积距相关系数，并记下所有的过程。 

b - 手动建立这10对数据的散点图。 

依据散点图是否可以预测相关是正向 

的还是负向的？为什么？ 


2. 使用下面的数据回答问题 2 a 和21> 

o 

+ (游完50码）速度 

力量（推举的重量级） 

2 L 6 

135 

23.4 

213 

26*5 

243 

25.5 

167 

20,8 

120 , 

19.5 

134 

20.9 ' 

209 

18.7 

176 

29 . 8 

156 

28,7 ' 

177 


^原文为第 n 部分。 


译者注 
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ATT 

图 5. 10数据集2的散点图 

2 a # r = • 269 0 

2 b . 依据这一章之前提供的图表，这个规模的相关强度是弱相关。决定系数 
是.269 2 ,或者方差的7.2%(. 072) 可以得到解释。主观分析（弱相关）和客观数 


a . 使用计算器或计算机计算皮尔逊相关系数。 

b . 使用相关系数从最弱到最强的值域范围来解释数据，并计算决定系数。 
主观分析和/值比较结果如何？ 

3 - 两个变量之间的决定系数是 . 64 ， 回答下面的 问题： 

a . 皮尔逊相关系数是多少？ 

b . 相关关系的强度如何？ 

c . 两个变量的关系中方差不可解释的部分是多少？ 

4.看图 5.3, 你是用什么类型的相关系数检验种族（定义为不同的类别）和 
政党背景的关系？是否是俱乐部成员（是或不是）和高中平均成绩之间的关系 
呢？解释你为什么选择这样的答案。 

练习参考答案 

1 a . r = , 596。 

lb . 依据 U 的答案，你已经知道相关是正向的。但是依据图 5. 10中所示的 
散点图 < 我们使用 SPSS ，但是你应该手动绘制），你可以预测这样的结论（即使实 
际并不知道相关系数的正 负号） ，因为数据点集合本身是从图的左下角到右上 
角，可以假定是正斜率。 
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爱上统计学 


3 c . I 〜 64, 或36% (.36)。 

4 - 你应该使用卡方系数检验种族和政党背景的关系，因为这两个变量的属 

性是定类的。你应该使用点二列相关系数检验俱乐部成员身份和高中平均成缋 

(GPA) 的关系，因为这两个变量的属性一个是定类的（俱乐部成员身份）另一个 
是定距的 （ GPA )。 * 


值(可解释方差的 7. 2% ) —致。 

Q - # * •§ /"j 


3 b . 非常强。 

















第皿部分 


抓讧辄驻有趣艾 

有 W 的轵全 


到目前为止你了解了什么，接下来又会学什么呢？首先，你已经具备了如何 
描 述一组 数据的特征以及数据分布如何区别的坚实基础。这是你在 《爱 上统计 
学》 第2章、第3章和第 4 章学到的内容。在第5章你也学了如何使用相关工具 

描述变量间关系。 

现在是加大赌注真正开始玩儿的时候了。在< 爱上统 计学》 第 D 1 部分，第6 
章向你介绍假设检验的重要性和性质，包括对假设检验是什么、有几种不同的类 
型、假设的功能以及假设为什么和如何被检验的深度讨论。 

接着，我们通过讨论正态曲线说明概率的所有重要方面，以及作为概率基础 
的基本原则，作为统计学的一部分，概率能帮助我们定义某类事件（如一次考试 
中的特定值）发生的可能性。我们将使用正态曲线作为这些讨论的基础，而且你 
会看到一个数据分布中任何数值或事件的发生具有与概率一致的可能性。 

带着乐趣学习了概率和正态曲线之后 | 我们准备在第 IV 部分开始更进一步 
的讨论，主要是依据假设检验和概率论的应用来检验有关变置间关系的特定问 
题。从现在开始只会越来越好。 
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• 样本和总体之间的差异 
• 零假设和研究假设的重要性 
• 判断一个好假设的标准 


也许你想成为一个科学家 

* 

你可能已经在其他的课程中听到了假设这个词 D 你甚至不得不为了 
你在其他课上所做的研究建立一个假设，或者你在期刊文章中已经看到过 
—两次。如果是这样，你可能对假设是什么已经有了很好的认识。对于你 
们中不熟悉这个词的人来说，假设 （ hypothesis ) 基本上是“学术猜测”。假 

设最重要的角色是表示一般问题的陈述，或在最初的时候促使人们去探索 
研究的问题。 

这就 是为作 么花费精力和时间去建立一个简要和清晰的研究问题是 
如此重要的原因。研究问题是建立假设的指导，相应的假设决定你用于检 
验假设以及回答最初提出的问题的 技术。 

因此，一个好的假设将问题陈述或研究问题转换为更适合于检验的形 
式。这种形式就叫做假设。我们将在本章后面的部分讨论如何才能建立 
一 个好的假设。在这之前，我们的注意力会转向样本和总体的差异。这是 
重要的区别，因为假设检验是用于样本，然后才将结论一般化到更大的总 
体。接着将注意力转向假设的两个主要类型（零假设和研究假设）。现在 

首先让我们给在《爱上统计学》前面章节用到的一些简单的术语做 正式的 
定义。 * 

样本和总体 


作为一个好的科学家，你可能会说如果方法 A 比方法 B 好，这是永 
远、一直而且对宇宙所有人都正确的，对吗？实际上如果你依据方法 A 和 
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方法 B 相应的优点进行足够的研究，并检验了足够的总体，你总有一天会 
这样说。但是不要太激动，因为你不可能如此确信地这样说。这会花费太 
多的钱 （$$$) 和太多的时间（用所有的人）来做那些研究，另外这甚至是 
不必要的。相反你只要从总体中选择一个代表性样本，并 R 检验有关方法 
A 和方法 B 的假设。 

儿乎所有的科学家都受到没有足够的时间和足够的研究基金的限制， 
所以最好的策略是从一个较大总体中选取一部分，并在这个较小的群体中 
进行叫究。 /i 〖仲情况下，较大的肝:为总 _M. population ) ，从这个总体 
中选择的较小群体就是样本 （sampleh 



测量样本和总体特征近似程度的量数叫做抽样误差 samp ] ng 
error ) 。 抽样误差基本上就是样本统计值和总体参数之间的差异。 
抽样误差越大，抽样过程中的精确性越低，且应用样本中的发现真 
实反映总体中预期发现就更加困难。 


样本应该以这样的方式从总体中选取，就是样本要尽可能和总体的特 
征匹配。目标就是使得样本尽可能地类似总体。保证这两个群体类似的 
最重要的应用是基于样本的研究结论可以一般化到总体。如果样本确实 
代表了总体，就可以说研究结论具有很高的一般化水平。 


零假设 


好吧，我们已经从总体中选择了一个样本来检验我们的研究假设，我 
们首先要建立零假设 （null hypothesis ) 。 .. 

零假设非常有趣。如果它能讲话 ，一 定会说类似这样的话，“我代表 
你们正在研究的两个变量无关”。换句话说，零假设就是可以由下面一些 
取自非常流行的社会和行为科学期刊的真实的（简短的）零假设说明的等 
价命题。为了保护个人隐私我们改变了名称。 

•9 年级学生的 ABC 记忆考试的平均成绩和12年级学生的平均成绩 
没有差异。 • 

• 由社区长期照料老人的效率和由家庭长期照料老人的效率没有 
差异。 

•反应时间和问题解决能力无关。 

• 白人家庭和黑人家庭提供给孩子的与学校活动有关的支持在数量 
上没有差异。 

这四个假设的共同之处在于他们都宣称两个或多个事物之间是等同 
的或没有关系的。 
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枣假设的铒的 

零假设的基本目的是什么？零假设既是研究起点也足测堡实际的研 
究结果的基准。 

现在让我们更详细地讨论每一个目的。 

首先,零假设是研究的起点，因为在没有其他信息的情况下零假设就 
被看作可接受的真实状态。例如，我们上面给出的第一个零 假设： 

9年级学生的 ABC 记忆考试的平均成绩和12年级学生的平均成绩没 

有差异。 

如果对9年级和12年级学生的记忆技能没有更多了解，就没有理由 
相信这两个群体之间存在差异，对吧？如果对变量间的关系没有任何了 
解，你能做的最好的就是去猜测。这就要承担一定的风险。你可能对一个 
群体为什么比另一个群体做得好做出猜测，但是你没有先验的（在事实之 
前）证明，那么除了假定他们是相同的之外还有什么选择？ 

不存在某种关系作为研究的起点是整个主题的重点。换句话说，直到 
你能证明存在差异，否则你只能假定没有差异。而无差异或无关的陈述 |1 
是零假设的所有内容。 > 

进一步讲，如果这两个群体之间存在任何差异，你必须假定这些差异 
是出于偶然，这是对任何两个群体之间在任何变量 h 的差异的最有吸引力 
的解释^■存在偶然性！这是对的，如果没有其他信息，偶然性总是对观 
察到的群体之间的差异或变量之间的关系的最可能和最有吸引力的解释。 
偶然性解释我们不能解释的差异。你可能已经把偶然性看作是在游戏机 
上赢得5 000美元大奖的儿率，但是我们讨论的偶然性完全是其他的“事 
物”，它掩盖事实，甚至使得理解变最间关系的“真实”性质变得更困难。 

例如,你选取了一组橄榄球队员和一组足球队员来比较他们的跑步速 
度。但是要考虑所有我们不知道的可能导致速度差异的因素。有谁知道是 
否一些橄榄球队员进行了更多的练习，或者一些足球队员更强壮？或者两 
组队员都接受了额外的训练？更重要的是，也许测定他们速度的方式本身 
就有很大的偶 然性； 出问题的秒表或大风天可能导致了与真实速度无关的 
差异。作为好的研究者,我们的工作是解释观察到的差异时消除偶然性因 
素，并评价其他可能导致群体差异的因素，例如有目的的训练或营养计划， 
并分析这些因素如何影响速度。重点是如果我们发现群体间的差异并且差 
异不是由于训练弓 I 起的，我们就很难将差异归结为偶然性之外的其他因素。 

零假设的第二个目的是提供与观察到的结果进行比较的基准，进而分 
析是否是由于其他因素引起这狴差异。零假设有助于定义观察到的群体 
间的差异范围是由偶然性引起（这是零假设的论点）还是由偶然性之外的 
因素（这可能是其他变量影响的结果，例如上个例子中的训练）引起。 

许多的研究暗含着零假设，而你不能在报告和期刊文章中清楚地发现 
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零假设的表述。但是你会发现明确表述的研究假设，这是我们接下来要关 
注的内容。 

研究假设 

零假设是变量间无文的陈述，而研究假设 （research hypothesi s ) 是变量 
间有关系的明确陈述。例如对于之前陈述的每一个零假设，都有一个对应 
的研究假设。注意我们说到相应的研究假设时用的是“不定冠词”而不是 
“定冠词”，因为对任何一个零假设来说肯定存在不止一个研究假设。 

•9 年级学生的 ABC 记忆考试的平均成绩不同于12年级学生的平均 
成绩。 

• 依据玛格奥莱斯社会活动量表的测量，社区长期照料老人的效果不 
同于家庭长期照顾老人的效果。 

• 较慢反应时间和问题解决能力正相关。 

• 白人家庭和黑人家庭提供给孩子教育活动方面的支持在数量上有 
差异。 

这四个研究假设有一个共同的方面。他们都是不等价的陈述。他们 
假定变量间存在一定的关系，而不是零假设假定的等价的关系。 

不等价关系可以采取两种形式-有方向研究假设和无方向研究假 

设。如果研究假设假定不等价关系没有方向（例如“不同于”），假设就是 
无方向研究假设。，如果研究假设假定不等价笑系有方向（例如“多于”或 
“少于”），这个研^假设就是有方向研究假设。 


无方向研究假设 


无力向研究假设 （ nondirection a 1 research hypothesis ) 反映群体间的差 

异》但是差异的方向是不确定的。 

例如研究假设 

9年级学生的 ABC 记忆考试的平均成绩不同于12年级学生的平 
均成绩 


是无向的，也就是两个群体间差异的方向不确定。假设只是陈述存在差 

异，但没有陈述差异的方向。因为差异是假设的所以是研究假设，但是差 
异的性质不确定。 


这里描述的假设是无方向研究假设，可以用下面的式子表示 





( 6 - 1 ) 


其中 

表示第一个（可能有几个）研究假设的符号 
X , 表示9年级学生样本的平均记忆成绩 
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叉, 2 表示 12 年级学生样本的平均记忆成绩 
#表示“不等于” 


有方向研究假设 

f i //向研究假设 （directional research hypothesis ) 反映群体间的差异， 

而且差异的方向是确定的。 

例如研究假设 

12年级学生的 ABC 记忆考试的平均成绩比9年级学1的平均成绩高 

是有向的，因为两个群体间差异的方向是确定的。一个被假设大于 （ 不仅 

仅是不同）另一个。 . 

其他两个有方向假设的案 例是： 

A 大于 B (或 A > B ) ， 或 B 大于 A (或 B > A > 

这两个假设由于特定的性质（大于或小于）都表示不相等。上面描述 
的12年级学生的成绩比9年级学生的成绩好的假设是有方向研究假设, 
可以用下面的式子表示： 

H x : X l2 > X 9 (6.2) 


其中 

H i 表示第 一 个（可能有几个〉研究假设的符号 
X 9 表示9年级学生样本的平均记忆成绩 
又 |2 表示12年级学生样本的平均记忆成绩 ‘ 

>表示“大于” 

研究假设的目的是什么？直接检验的研究假设是研究过程中的重要 
一步。通过比较检验的结果与随机预期的结果（也就是零假设）来确定这 
两个中哪一个是你观察到的群体间差异的更好的解释。 

下面是4个零假设和相应的有方向研究假设和无方向研究假设。 

表 6.1 零假设和相应的研究假设 


_ 零假设 

9年级学生的 ABC 记忆考试的 
平均成绩和12年级学生的平 
均成绩没有差异。 

依据玛格奥莱斯社会活动量表 
的测量，社区长期照料老人的 
效果和家庭长期照顾老人的效 
果没有差异。 


无方向研究假设 

12年级学生的 ABC 记忆考试 
的成绩不同于9年级学生的 
成绩 a 

依据玛格奥莱斯礼会活动 l 表 
的测量，社区长期照料老人的 
效果不同于家庭长期照顾老人 
的效果。 


有方向研究假设 

12年级学生的 ABC 记忆考 
试的平均成绩高于9年级学 
生的平均成绩。 

依据玛格奥莱斯社会活动量 
表的测社 E 长期照料老 
人的效果高于家庭长期照顾 
老人的效果。 
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续表 

零假设 

无方向研究假设 

有方向研究假设 

反应时间和问题解决能力 

反应时间和问题解决能力有 

反应时间和问题解决能力之 

无关。 

关系0 

间正相关。 

白人家庭和黑人家庭提供给孩 

子的支持数量没有差异。 

白人家庭提供给孩子的支持数 
t 不同于黑人家庭提供的支持 

数量。 

白人家庭提供给孩子的支持 
数量高于黑人家庭提供的支 
持数量。 



讨论有方向和无方向假设的另一种方式就是讨论单尾和双尾 
检验。单尾检验 （ one-tailed test 反映有方向假设）假定了特定方向 

的差异，如我们假设群体1的得分比群体2高。双尾检验 （ two - 
tailed test 反映无方向假设）假定差异没有特定的方向。如果你想 
检验不同类型的假设（单尾和双尾的检验），建立拒绝或接受零假 
设的概率水平，这个区别就十分重要。在第10章会有更多的讨 
论。我保证。 


研究假设和枣假设的一些区别 

除了零假设表示等价关系而研究假设表示不等价关系之外，这两类假 
设还有几个重要的不同之处。 

首先，简短地回顾一下，两类假设的区别在于一个 （ 零假设）表示两个 
变童之间没有关系（相等），而另一个（研究假设)表示两个变量之间有关 
系（不相等这是基本的区别。 

实次，零假设总是对应总体，而研究假设总是对应样本。我们从一个 
较大的总体中选择一个样本。接着我们试图将样本的结论一般化到总体 
屮。如果你还记得基本的哲学和逻辑原理（你 Q 经上过了这些课，对 
吧？），就会知道从一个小群体（如样本）到一个大群体（如总体）过程就是 
推论。 • 

第三，因为总体不能直接进行检验（再说一次，这是不现实、不经济 
的，而且通常是不可能的），你不能百分之百肯定地说样本之间在某些变 
M 上真的不存在区别。另外，你只能依据样本的研究假设的检验结论来做 
出间接推论。因此零假设只能被间接检验，而研究假设能够被直接检验。 

第四，零假设常用希腊宇母表达，而研究假设常用罗马字母表达。例 
如9年级学生的平均成绩等于12年级学生的平均成绩的零假设可以如下 

表尔： 


其中 


= Ml2 


(6-3 丨 
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i 

Hq 表示零假设 

表示9年级学生总体的理论平均值 
/ x , 2 表示12年级学生总体的理论平均值 

研究假设是12年级的样本的平均值高于 9 年级的样本的平均值，如 
公式 6. 2所示 

最后，因为你不能直接检验零假设，零假设是暗含的假设。而研究假 
设是明确的，且便于表达。这就是你在研究报告中很少看到零假设而几乎 

总是看到研究假设陈述的另一个原因。 

好假设的标准是什么 

9 

现在你知道假设是学术猜测——是进一步研究的起点。对所有的猜 
测来说，一开始其中的一些就比另一些好。我们不能过分强调提出你想回 
答的问题并 a 记住你提出的任何假设都是对你要问的原始问题的直接扩 
展是多么重要。问题反映你个人的兴趣和动机，以及已完成的研究。广解 
这些之后，你可以使用下面的标准来确定在研究报告中看到的假设或者自 

己建立的假设是否是可接受的假设。 

我们使用一个研究案例来说明这一点，这项研究是考察为工作到很晚 
的身为父母的员工提供的放学后儿童照料对父母工作适应性的影响。下 
面是一个很好的假设： 

i 

让自己的孩子加入放学后儿童照料计划的父母一年之内耽误的 
工作日 会减少，同时依据工作态度调查的测量，工作态度也会比没有 
让自己的孩子加入这个计划的父母更积极。 

下面就是标准。 

首先，一个好的假设一般是以陈述句的形式出现而不是以问题出现。 
在上面的案例中，没有提出“你是否认为父母和他们工作的公司会更好 
…？”这样的问题，这是因为陈述如果是明确、有力的，假设就更有效。 

其次，一个好的假设提出变量间预期的关系。案例中使用的假设清楚 
地描述了放学后儿童照料、父母的态度和缺勤率之间的关系。这些变量会 
接受检验来考察一个变量（加入放学后儿童照料计划）对其他变虽（缺勤 
率和态度）的影响。 

注意到上面的标准中“预期的”一词吗？定义预期的关系是为了避免 
像钓鱼式乱放枪一样漫无目的地建立一些无用的关系。 





6 你、和假设 .•检 验你的问题 


81 




钓鱼方法就是你把线扔出去，然后抓住仃何咬了线的东四。 
你收集尽可能多的数据而不管研究兴趣是什么，或者你收集的数 
据是否是科学调査的一部分3或者你把枪装满子弹，然后向任何 
移动的东西射击，你肯定能射中什么。问题是，你吋能不想要你射 
屮的，更糟糕的是你可能错过你想要的 t 最坏的是（如果可能）你可 
能不知道你射中的是什么。好的研究人员不仅仅想要他们抓到或 
者射中的任何东西，而且他们想要特定的结果。研究人员想得到 
想要的数据就需要开放性的问题和明确、有力且容易理解的假设。 


第三，假设反映它们建立的理论和文献基础。就如在第1章看到的， 
科学家的成功很少是归结于他们自己的努力工作。他们的成功通常是由 
于，或者说部分是由于走在他们前面并留下后来的解释框架的科学家 。一 
个好的假设要反映这一点，这样假设就和已存在的理论和文献连接在一 
起。在上面的案例中，我们假定有文献表明父母知道孩子在妥当的环境中 
得到照料就会感到更放心，然后就能在工作中表现得更好。了解这些就可 
以假设放学后照料孩子计划能提供父母所寻求的安心。相应的父母就会 
集中精神工作而不是不断地打电话确定他们的孩子雷切尔 （ Rachel ) 或者 
格雷戈里（ Gregory ) 是否安全到家。 

第四，假设应该简短并切中要点。你要使假设以陈述句的形式描述变 
量间的关系，并且尽可能直接和明确。越是切中要点，其他人 （ 如你的硕 
士论文或博士论文答辩委员会成员）就越容易阅读你的研究、理解你的假 
设是什么以及重要的变健是什么。实际上，当人们阅读并评价研究（你会 
在后面的章节学到更多）时，他们中的大多数做的第一件事就是找到假 
设，从而就对研究的一般目的和研究是如何进行的有了很好的了解。一个 
好的假设可以反映这两个方面。 

第五，好的假设是可检验的假设。这意味着你可以实际的回答假设中 
包含的问题。你可以从上面的示例假设中看到让孩子加人放学后照料计 
划的父母和没有让孩子加人的父母之间的重要比较。态度或缺勤的天数 
是可测 S 的变量。两者都是合理的目标。态度对以通过工作态度调查来 
测量（假定的题目，但是你可以了解），缺勤（缺勤的天数）很容易被精确地 
记录。如果建立的假设是“让孩子加人放学后照料计划的父母对工作的 
感觉更好”，想想还会有多少困难的事。即使你得到相同的信息，“感觉更 
好”这个模棱两可的词就会使得结果更难解释。 

总之，假设应该 
• 以陈述句的形式表述 
•假定变量间的关系 
• 反映假设建立的理论和文献基础 
•简短并切中要点，并且 
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• 可检验。 

如果假设满足这五个标准，你可以了解这个假设很好，足以继续进行 


研究，来准确地检验作为假设来源的一般问题 a 



小结 


任何科学研究的中心要素是假设，而不同的假设类型（零假设和研究假设> 
有助于形成计划来回答我们的研究所提出的问题。零假设作为研究起点和比较 
基础的特点使得我们可以使用零假设作为评价研究假设可接受的比较基准。现 
在我们继续学习如何实际检验零假设。 


练习时间 

1. 去图书馆查找你感兴趣的领域的五个经验研究文章（包含数据）。对于每 
一 个研究，列出下面的内容： 

a . 零假设是什么 （ 潜在的还是明确的陈述）？ 

b . 研究假设是什么（潜在的还是明确的陈述）？ 

c . 在你感兴趣的领域，建立一个零假设和一个研究假设。 

d . 那些没有明确的或潜在的假设的文章又怎样呢？确认这些文章，并看看 
你是否可以建立一个研究假设。 

2. 依据下面的研究问题，建立一个零假设 ，一 个有方向研究建设 ，一 个无方 
向研究假设。 

a . 注意力对教室里不专心听课行为的影响如何？ 

b . 婚姻的质量和夫妇双方与他们兄弟姐妹间关系好坏之间的关系如何？ 

c . 治疗厌食症的最好方式是什么？ 

3. 回到问题 1 中找到的 5 个假设，并用本章最后部分讨论的 5 个标准进行评 
价。 

练习参考答案 

问题 1 和问题 3 会因为你的兴趣而不同。因此，虽然没有正确的答案，但是 
不同的假设很多。 

2 a . 零 假设： 依据注意时间观察量表的测量，注意时间短的学生和注意时间 
长的学生不专心听课行为的频率相同。 

有方向研究 假设： 依据注意时间观察量表的测量，注意时间短的学生比注意 
时间长的学生不专心听课行为的频率要高。 

无方向假 设：依 据注意时间观察量表的测量，注意时间短的学生不专心听课 
行为的频率不同于注意时间长的学生。 

2 b . 零假 设：婚 姻质量和夫妇双方与他们兄弟姐妹关系的好坏之间没有 

关系。 ' 

有方向研究 假设： 婚姻质量和夫妇双方与他们兄弟姐妹关系的好坏之间有 
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正向关系。 ， • 

无方向 假设： 婚姻质量和夫妇双方与他们兄弟姐妹关系的好坏有关。 

2 c . 零 假设： 结合传统心理治疗的药物治疗和单独的传统心理治疗对治疗厌 

食症有相同的效果。 

有方向研究假设：结合传统心理治疗的药物治疗比单独的传统心理治疗对 
治疗灰食症更有效。 

无方向假设 ：结合 传统心理治疗的药物治疗和单独的传统心理治疗对治疗 
厌食症具有不同的效果。 - 



你的曲线是正态的吗 
概率和概率的重要性 




• 为什么理解概率是理解统计学的基础 
• 什么是正态曲线或钟型曲线，其特点是什么 
• 如何计算和解释2值 


为什么学习概率 

现在你认为送是统计学课程 r 吧！好吧，就如你在这一章将学到的， 
学习概率是理解正态曲线（接着会有更多讨论）的基础，也是理解推论统 
计的基础。 

为什么？首先，正态曲线给我们提供了理解任何可能结果（如一次考 
试屮得到某个具体分数的几率，或者投掷硬币时得到正面的几率）的概率 
的基础。 

其次，概率研究是决定我们在陈述特定的发现或结果是“真”时所具 
有的可信度的基础。或者更好的说法是，某个结果（如平均成绩）没有出 
现是由于偶然因素。例如，我们比较 A 群体（每星期参加3小时的额外游 
泳训练）和 B 群体（每星期都没有额外训练）。我们发现 A 群体的适度性 
测验和 B 群体不同。但是我们可以说送个差异是由于额外训练引起，或 
者是其他因素引起的吗？概率研究提供的工具允许我们确定差异是由于 
练习或其他因素引起的准确的可能性数值。 

上一章我们花费在假设上的所有时间都是值得的。一旦把对零假设 
和研究假设的理解和概率基础的想法结合在一起，我们就可以讨论特定结 
果（由研究假设建立）出现的可能性。 

正态曲线（或钟型曲线） 

什么是正态曲线？正态、曲线 （nomml curve , 叫做钟型曲线，或钟形曲 
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线）就是具备三个特征的数据分布的形象表示。图7,1表明了这三个 
特征。 



均值 

中位数 

众数 


图 7.1 正态曲 线或钟形曲线 

!1_:态曲线表承均值、中位数和众数相等的数值分布。你可能还记得第 
4章的内容，也就是如果中位数和均值不同，那么数据分布就向某个方向 
倾_斜。1!_:态曲线没有偏度。正态曲线有一个很好的波峰（只有一个），而 
且波峰正好处于中间。 

其次，正态曲线以均值为中心完全对称。如果沿着中心线将曲线对 
折，两边会完全重叠。两边是相等的。曲线的一半是另一半的镜像。 

最后（准备好学习新的内容），」 I :态曲线的双尾是渐近的 （ asymptot ¬ 
ic )* ——一个很陌也的词。这个词的含义是曲线的双尾越来越逼近横轴， 
但是永远不会与横轴相交。 

正态曲线的钟型形状给这个曲线另外一个名称，也就是钟型曲线。 



即使作者对渐近性有很好的了解，他也想知道正态曲线的尾 
线如何逼近横轴或 x 轴却永不相交。试着做下面的实验。放置两 
支相距一英寸的铅笔，然后移进一半，他们就相距1/2英寸，再移 
近1/4英寸，再移近1/8英寸。这两支铅笔会持续的接近，对吧? 
但是不会（永远不会）相交。正态曲线的尾线同样如此。尾线缓慢 
地接近曲线“栖居”其上的数轴，但是永远不会真正相交。 

这一点为什么很重要？在本章后面的部分你将会了解，尾线 
从不相交的事实意味着可能得到的极值 （ 在曲线的左侧或右侧）存 
在无限小的可能性。如果尾线和数轴相交，就得不到原本可能存 
在的极值了。 


嚷，这不是正 态曲蟆 

我们希望你接 K 来的问题是/‘但是有许多数据集的分布不是正态的 
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或不是钟型的，对吧？”是的。但当我们处理大样本数据集（超过30个数 
据），并且重复地从总体中抽取样本时，曲线的数值就接近正态曲线的形 
状。这很重要，因为我们讨论的通过样本推论总体时所做的大多数工作都 
是基于这样的假设——总体中抽取的样本是正态分布的。 

而且事实是大体上许多事物的分布特征就是我们所说的正态分布。 
也就是说大多事件或发生次数正好在数据分布的中间，而两端却较少，就 
如在图 7. 2中所看到，图 7. 2表示一般总体中 IQ 和身高的分布。 



. - 图 7. 2数值如何分布 

例如，一个群体中聪明人很少，处在群体底端的智力或认知能力很低 
的人也很少。大多数人正好处在曲线的中间，而我们移到曲线的尾线时人 
数减少。高个的人相当的少，矮个的人也相当的少，而大多数人处在中间。 
在这两个案例中，智力和身高的分布接近正态分布。 

相应的，正态曲线中极值范围内发生的每一个事件具有很小的发生概 
率。我们可以很确信地说任何人（我们还不知道他们的身卨）个子很高的 
几率不是很大。但是我们知道任何人处于平均身高的几率或者正好处于 
中间范围的几率很高 D 那些发生在^态曲线中间的事件的概率高于极值 
范围内发生的事件的概率。 

更正4的曲綵101 

你已经知道有三个主要的特征使得曲线成为正态曲线，或者看起来更 
像钟型，但是正态曲线不仅仅是这三个特点。认真地看图 7. 3中的曲线。 
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(均 值) 

标准差 —— 一3 -2-10123 

图 7.3 分成多个部分的正态曲线 

这里展示的分布的均值是100,标准差是】0。我们已经在*轴上增加 
了表示数据分布中偏离于均值的以标准差表示的距离。你可以看到戈轴 
(表示分布中的数值）的刻度是以 10( 也就是分布的标准差）为间隔从70 
增加到130,10是一个标准差的值。我们编制了这些数字 （100 和 10)，所 
以不要去猜测我们如何得到这些数字。 

如此，短暂的回顾告诉我们分布的均值是100,标准差是10。曲线内 
的每条垂直线将曲线分成一个部分，每个部分由特定的值限定。例如均值 
100右端的第一部分由数值100和110限定，这表示偏离均值（均值是 
100) —个标准差。 

而且在每一个原始数值 （70,80,90, 100,110,120, 130) 下端，你会发现 
相应的标准差 （ -3, -2, -1，0，1，2,3>。就如你已经指出的，我们的案例 
中每一个标准差是10。因此偏离均值（均值是 100) —个际准差就是均值 
加10或者是110。不是很难，对吧？ 

如果我们深人进行讨论,你就能够看到均值为100,标准差为10的正 
态分布表示的数值范围是70到 130( 包括 -3 到3个标准差）。 

有关正态分布、均值和标准差的一个重要事实始终是 f 确的： 对任何 
数值分布来说(不论均值和标准差的具体数值），如果数值是正态分布的， 
几乎100%的数值处于均值的 - 3 到3个标准差范围内。这非常重要，因 
为这个事实适合所有的正态分布。因为这个规则的确很实用（再说一次, 
不论均值和标准差的具体数值），所以数据分布之间可以相互比较。接下 
来我们还会讨论。 

接着上面的内容，我们再进一步深入讨论。如果数值分布是正态的， 
我们也可以说一定丫 i 分比的数值会落在％轴的不同数据点之间（例如均值 
和一个标准差之间）。实际上数值分布中大约34% (实际上是 34. 13% ) 
的数值落在了均值（在这个案例中是100——计算出来了吗？）和均值以上 
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I 个标准差（就是 110) 的范围内。你可以将这个事实“存人银行'因为这 
是永远正确的。 

想了解更多吗？认真地看图7.4。你可以看到特征明显的同样的正 

皆 

态曲线（均值等于100,标准差等于⑴——以及均值和标准差限定范围内 
我们预期出现的数值的百分比。 



标准差 —-3 -2-10 I 2 3 


图 7.4 正态曲线下数据值的分布 


下面是我们可以得出的结论。 


两者间的距离 

包括的数据值 

运括的数值范围(如果均值 
= 100,标准差 = 10) 

均值和丨个标准差 

曲线镫 m 34. 13%的数据值 

100 110 

1个标准差和2个标准差 

曲线覆盖 13. 59%的数据值 

110— 120 

2个标准差和3个标准差 

曲线覆盖 2. 15%的数据值 

120—130 

3个标准差及以上 

曲线覆盖0.13%的数据值 

130以上 


如果你将正态曲线每一半的百分值加起来，猜猜你会得到什么？很 
对，是50%。为什么？正态曲线之下，均值和均值右侧所有数值的距离范 
围内包括了 50%的数值。 

因为曲线是中心线对称的（每一半是另一半的镜像）■，两个部分加起 
来表示100%的数值。虽然不是火箭科学，但是指出这一点很重要。 


现在我们将这个逻辑应用到均值100左侧的数值。 


两者间的距离 

包括的数据值 

包括的数值范围（如果均 
值= 100, 标准差 = 10) 

均值和 1 个标准差 

曲线覆盖 34, 13% 的数据值 

90 100 

-1 个标准差和 -2 个标准差 

曲线覆盖 13. 59% 的数据值 

80—90 

-2 个标准差和 -3 个标准差 

曲线覆盖 15% 的数据值 

70—80 

-3 个标准差及以下 

曲线覆盖 0.13% 的数据值 

70 以下 
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现在要记 Hi 的是我们使用的均值100和标准差10仅仅是特定案例的 
样本统计值。很明显，不是所有的分布都是均值为100、标准差为10。 

所有的这些都有规律，特别是你会发现 34. 14% .13. 59%等数值独立 
于实际的均值和标准差。粗略地说这个数字是3 4 %，这是因为曲线的形 
状而不是因为具体的均值和标准差。实际上，如果你在一个硬纸板上绘制 
正态曲线，接着将均但和一个标准差范围内的区域切下来，然后称出重量， 
重 M 恰好是从中切除曲线的整个硬纸板的 34. 13%。（试一次，这是 

真的。） 

在我们的案例中，这意味着（粗略地说)68% ( 奴倍的 34. 13%)的数值 
落在原始数据90到丨】0之间。那么其他32%呢？这个问题很好。一半 
(16%，或者13,59% +2. 15% +0. 13% ) 落在均值的一个标准差以上（均 

值右侧），另一半落在均值的一个标准差以下（均值左侧）。而且因为曲线 
的斜率，所以数值越偏离均值，曲线覆盖的区域的范围就越小，那么一个数 
值落在数据分布极值范围内的可能性要小 P 落在中间的可能性，这一点不 
惊奇。这也是为什么曲线在中间有波峰而没有任何方向的偏度。 

我们最中意的标准值: Z 值 

你已经多次看到数据分布在集中趋势和变舁性方面如何的不同。 
在一般的研究实践中，我们会发现所处理的分布相当不同，但是我们 
需要对它们进行相互比较。而进行这样的比较我们需要一定的标准。 

这就是标准值 （standard scores )。 这搜值以标准差为单位进行了标准 
化所以是可比较的。例如，均值为50,标准差为10的分布的标准值与均 
值为100,标准差为5的分布的标准值都是1 ;他们都表示一个标准值，并 
且与各自均值的距离也相同。我们也可以使用正态曲线的知识，并确定偏 
离均值一个标准差的数值出现的概率。我们在后面会继续。 

虽然还有其他类型的标准值，但是学 > J 统计学过程中最常看到的是^ 
值 （z score )。 z 值就是原始数据与数据分布均值的差除以标准差所得的结 
果（见公式 7. 1)。 

(7.1) 

S 

其中 

Z 是名值 

X 是具体的数值 
无是数据分布的均值 
s 是数据分布的标准差 

例如，应用公式 7. 1你可以看到如何计算均值是100原始数值是110 
标准差是10的2值。 
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下面是均值为12,标准差为2,样本规模为10的原始数值和相应的 Z 
值。均值以上的原始数值对应的 Z 值是正数，反之，均值以 K 的原始数值 
对应的 z 值是负数。例如，原始数值15对应的 z 值是+ 1.5,原始数值8对 
应的 z 值是当然与均值相等的原始数值 12( 或均值）的$值是0,因 
为原始数值与均值的距离为0。 


X 

X-X 

2 值 

12 

0 

0 

15 

3 

L5 

11 

— 1 

-0,5 

13 

1 

0,5 

8 



14 

2 

1 

12 

0 

0 

13 

1 

0.5 

12 

0 

0 

10 

n 

■gwfe jT 

-1 


依据对以上数值的观察进行简要的总结。 

首先，均值以下的数值 （ 如8和 10) 对应的 Z 值是负数，而均值以上的 


数值（如13和 14) 对应的2值是正数 


o 


o 


其次，正的 Z 值一般落在均值的右侧，也就是数据分布的上半部分。 
负的 Z 值通常落在均值的左侧，也就是数据分布的下半部分 

第三，我们讨论落在均值一个标准差以上的一个数值时，也就是说这 
个数值是在均值的一个标准值之上。就我们的目的来说，比较数据分布的 
数值时使用标准差和 Z 值是相当的。换句话说， Z 值就是偏离均值的标准 
差的个数。 


最后也是最重要的一点，不同分布的 Z 值具有可比性。我们应用下面 
的数据表说明这一点，这个数据表和上一个类似。我们从100个数值中选 
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f 10个样本数值，样本分布的均值是59，标准差是 14. 5 


原始数值 

x-lc 

z 值 

67 

8 

0,55 

54 

-5 

-0,34 

65 

6 

0.41 

33 

— 26 

- L79 

56 

— 3 

-0*21 

76 

17 

1. 17 

65 

6 

0-41 

33 

-26 

-1.79 

48 

-11 

-0,76 

76 

17 

L 17 


在之前看到的均值是12标准差是2的数据分布中，原始数值 12.8 对 
应的 Z 值是+0.4,也就是说原始数据 12.8 距离均值 0.4 个标准差。在均 
值是59标准差是 14.5 的第二个数据分布中，原始数值 64. 8对应的 Z 值 
也是 +0. 4 。 这是奇迹吗？不，这只是一个很好的想法。 

原始数值 12.8 和 64. 8相对来说与均值的距离相等。如果这些原始 

数值用标准值表示，就可以直接使用#自分布中的相对位置来直接进行相 
互比较。 

z 值表示什么 

你已经了解特定的值表示一个原始数值，也表示数据分布在轴上 
的特定位置。而且 z 值越大 （ 例如 -2 或 +2.6) ，距离均值越远。 

因为你已经知道落在 x 轴的特定两点之间的面积的百分比，例如均值 
和+ I 个标准差之间的面积是34%，+ 1个标准差和+2个标准差之间的 
面积是14%，我们也可以得出如下正确的 结论： 

*84%的数值落在值为+ 1的2值之下（50%落在均值之下，34%落 
在均值和值为+ 1的2值之间)。 

• 16%的数值落在值为+ 1的 ir 值之上（曲线下的全部面积是100%， 
84%的数值落在值为+ 1的; r 值之下） 

想一下上面的两个结论。我们所要表达的是，如果数据分布是」 I :态分 
布，曲线的不同面积可以用标准差或者 z 值的不同数值来表示。 

当然要明白这些面积或比例也可以很容易地被看作是表示特定数值 
出现的概率。例如，这里有一个 问题： 

在均值为100标准差为10的数据分布中，110或 U 0 以上的数值出现 
的概率是多少？ 

答案是16%，或者说100次中会出现16次。我们如何得到答案？ 
首先我们计算对应的 Z 值，也就是+ 1〔 （ 110 - 100)/10] 0 接着，依据 
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我们已了解的知识（见表 7. 4)，我们知道 z 值为1表示 x 轴上的一个特定 
位置，数据分布中 84% 的数值落在这个位置之下，这个位置之上是 16% 的 
数值或概率是 . 16。因为我们已经知道均值和均值之上或之下〗，2和3个 
标准差之间的面积，我们可以很容易地得出任何 z 值对应的数值出现的 
概率。 

但是我们介绍的方法对于=值是 1 ,2 和 3 很合适。但是如果 z 值不是 
像 2 —样的整数，而是像 1. 23, -2.01 —样的非整数，该如何确定呢？我 
们需要找到更简洁的方法。 

我们怎么办呢？很简单，就是学会微积分并将微积分应用到正态曲线 
来计算$轴 k 每一个可能的值对应的曲线面积，或者我们更离欢使用附录 
B (正态分布表）的 B 1 表。表中列出了不同2值对应的曲线之下的所有面 
积数值，当然不包括极值。这个表有两列。第一列是 z 值，就是已经计算 

的 z 值。第二列是均值和 z 值之间的面积，就是这两点之间曲线所覆盖的 
面积。 

例如，如果我们想知道均值和值为+ 1的 Z 值之间的面积，在 4 T 值列找 
到数值 1.00, 接着在对应的第二列找到均值和; r 值 1.00 之间的面积数值 
34.13。你以前看到过这样的表吗？ - 

为什么在表中没有正号或负号，如 -1.00 呢？因为曲线是对称的 

值是正是负对数值没有影响。均值和1个标准差之间的面积在任何方向 
上都是 34. 13%。 

接着往下。对于特定的 z 值如 1.38 来说，你想知道与 z 值对应的概 
率。如果你想知道均值和 z 值 1.38 之间的面积百分比，你可以在 B 1 表中 
找到对应 z 值1 .3 S 的面积是41 . 62，这表明数据分布中41 %以上的数据落 
在2值0和1,38之间，而92%(50% +41. 62%)的数据落在2值 1*38( 包 
括 1.38) 之 F 。 现在你肯定已经注意到最后的案例中根本没有提到原始 
数值。一旦你会用这个表，就不再需要原始数值。 

但是我们是否始终只对均值和一些 z 值之间的面积感兴趣？要不要 
关注两个 z 值之间的面积呢？例如，我们有兴趣知道的是 z 值 1.5 和 z 值 
2.5 之间的面积，或者说数值落在这两个 z 值之间的概率是多少？我们如 
何使用这个表计算这些结果？这很容易。只要找到每一个 z 值对应的面 
积，然后用一个减去另一个。通常绘制如图 7. 5所示的图有助于我们 
理解。 

例如，我们想找到均值为100,标准差为10的数据分布中原始数值 
110和125之间的面积。我们可以釆用如下的步骤^ 


1 一计算原始数值丨10对应的2值，也就是 （ 110 - 〗00 ) /】0,即+ i 。 

2 — 计算原始数值 125 对应的 z 值，也就是 （ 125 - 100)/10, 
即 +2.5 。 

3— 使用附录 B 的 B 1 表，找到均值和2值+ 1之间的面积，是 
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34. 13%。 

4— 使用附录 B 的 B 1 表，找到均值和 z 值 +2. 5之间的面积, 
是49,38%。 

5— 因为你想知道两个2值之间的距离，用较大的数减去较小的数, 
也就是 49. 38% -34. 13%，结果是15.25%。图 7.5 中包含很 

多信息。 




7,5 


绘图说明不同2值之间面积的差异 


因此我们十分确信，特定数值出现的概率可以通过确定这个数值相对 
其他数值落在数椐分布的某个区域来进行很好的理解。在这个案例中，数 
值岀现在 Z 值+ 1和 Z 值 +2.5 之间的概率大约是15%。 

这儿还有另一个例子。在均值100,标准差10的数据集中，原始数值 
117对应的 z 值是1.70。这个 z 值对应的曲线覆盖面积是 95. 5 4 % (50% 
+ 45. 54%)，意味着数值出现在2值1 . 70之下的概率是 95. 54% * ，或者 


说100个中有 95.5 个，或者是* 955。 





关于标准值的两个方面。首先，虽然我们关注的重点是 z 值， 
但还有其他类型的标准值 o 例如，: T 值是另一种类型的标准值，通 
过^值 乘以⑴加50来计算。这个标准值的优点是很少出现负值。 
和 z 值一样， r 值也可以比较不同数据分布的数值。 

其次，标准值和标准差完全不同。标准值来自预先确定均值 
和标准差的数据分布。考试成绩如 SATs 和 GREs ( 研究叱人学考 
试）的标准值的使用可以很容易地比较均值相标准差相同的数据 
分布的 数值。 • 




原 U 为 I 值0和 1.70 之间。译者注 
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z 值真正表示什么 

统计游戏的另一个作用是能够估计某个结果的概率。如果我们掌握 
了前面的内容并且能够在本章学习中再往前走一步，就能确定某些特定事 
件发生的概率。接下来我们使用一些标准来判断我们考虑的事件的发生 
是髙于还是低于我们预期的随机概率水平。研究假设提出了预期事件发 
生的命题，我们使用统计工具来估计事件发生的概率。 

这是统计学是什么的“20秒版本”，但是包含了很多内容。现在我们 
回顾这一段所有的内容，并通过案例来理解。 

比如说你的老朋友，值得信赖的卢给了你一枚硬币，并让你决定硬币 
是否是“真的”——也就是你抛十次硬币 ，可 以得到5次正面5次反面。因 
为每抛掷一次出现正面或反面的概率是 . 5，所以我们预期岀现5次正_ 和 
5 次反面。在10次独立的拋硬币实验中（也就是一次抛掷不会影 响下一 
次），我们应该得到5次正面.等等。现在的问题是出现多少次正_会确认 
这枚硬币是伪造的或者非法的？ 

现在说说我们用以判断适当性的标准，也就是如果拋掷10次硬币我 
们得到正面（或者反面）的次数少于5%次，我们就能说硬币是伪造的，那 
就应该叫警察抓卢了 （ 或者他已经在假释中了）。5%就是统计学家们 
使用的标准。如果事件（:面出现的次数 、一 次考试的成绩或者两个数据 
组平均值的差异）发生的概率是极值（我们所说的极值定义为出现次数小 
于5% ) ，那么就是不可能出现的结果，在这个案例中就是不正当的结果。 

这是10次随机抛掷硬币实验中预期出现的 十:而 次数的分布。所有可 
能的结果组合是 21 °或1 024种，例如9次正面丨次反面，7次正面3次反 

面，10次正面0次反面，等等。而10次拋掷实验中得到6次正面的概率大 
约是21 %。 


正面次数 

概率 

0 

0.00 

1 

0.01 

2 

0.04 

3 

0, 12 

4 

0. 2! 

5 

0-25 

6 

0,21 

7 

0. 12 

8 

0.04 

9 

0-01 

10 

0.00 


以上是任何特定结果出现的可能性，如10次投掷中出现6次正面的 
可能性大约是 .21 ,或现在是做岀决定的时间。也就是10次抛掷 
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中你得到多少次正面就可以断定硬币损坏了、不均匀、或者是伪造的。 

与优秀的统计学家一样，我们定义的标准也是5%，之前我们也是这 
样定义。如果观到的结果（我们投掷硬币的结果)的概率小于5%，我们 
耐以断定这是不可能的，除非有非概率事件出现——我们的结论就是“非 
概率事件”是伪造的硬币。 

看看上面的数据表，你就会发现8、9或10次正面出现的结果都小于 
5%。因此，如果10次硬币投掷的结果是8、9或10次正面，结论就是这枚 
硬币不是真的。（当然正面出现 0、1 或2次也能得出相同的结论，这是对 
的。硬币另一面的岀现情形也如此。） ' 

相同的逻辑也适用于在之前关于 z 值的讨论。我们预期 z 值多大就 
可以断定一个结果的出现不是由于随机因素而是由于一些其他因素？如 
果査阅附录 B 的正态曲线表你会知道 z 值的临界点 1.65 包含了曲线覆盖 
面积的 45% ，如果与曲线另 - 侧覆盖面积的 50% 加起来，就得到全部面积 
的 95%。 也就是在^轴的这一点之上留下了 5%。 任何表示 z 值 1.65 或 

这个值以上的数值就在很小的区域内-或者至少是分布在出现的概率 

小于其他数值的区域内。 


假设松脸和 z 值：第一步 


我们所要说的是任何事件都有相应的发生概率。我们使用这些概率 
值来推断我们预期的某个事件不出现的可能性。例如，抛掷10次硬币出 
现1次 .11: 面9次反面的可能性就很小。我们也说过如果事件的发生100 
次中只有5次（5% ) ，我们就可以认为相对于其他可能发生的事件来说这 
个事件更不可能发生。 

研究假设相关的结论当然也同样如此。零假设（见第6章）认为群体 
或变量之间没有差异，而且发生的可能性是100%。我们要尽力检验零假 
设可能存在的错误。 

换句话说，如果通过研究假设的检验我们发现事件发生的可能性是极 
值，那么研究假设就是更有力的解释而不是零假设。因此，如果我们发现 
^值是极值（发生概率小于5%就是极值），我们就会说极值出现的原因不 
是由于随机因素而是与某种关系或者某种处理方式有关。我们会在接下 
来的章节更详细地讨论这一点。 


使用计算机计算 Z 值 


SPSS 真的可以完成很多任务，但是在这你会看到使用这个软 
件计算 Z 值是多么节锴 时间。 你已经知道如何手动计 算：? 值，现在 
使用 SPSS 来计算。 

应用 SPSS 计算图 7. 6中第一列所示的数据集（也是本章之前 
所示数据）的 z 值，步骤如下。 

1 . 在新的 SPSS 窗口输人数据。 
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2. ，疾击 Analyze — ^Descriptive Statistics—>Descriptive 0 

3. 双击变量名将变量移到 Variabl e ( S > 框。 

fi 

4. 在 Descriptive 对话框点击 Save Standardized values as varia ¬ 
bles 0 

5 . 点击 OK 。 



图 7,6 


使用 SPSS 计算 r 值 


你可以在数据显示窗口看到 SPSS 数据如何计算对应的 z 值。 

( 注意- SPSS 在完成所有的过程后，会自动进人结果输出窗口， 

但在输出窗口看不到 Z 值！你必须转换到数据显示窗口。） 



小结 


理解整个推论统计的最初的和最重要的技能就是可以计算 z 值^并能够估计 
在一个样本数据中某个数值出现的可能性。一旦我们知道考试成绩或者组间差 
异发生的可能性，我们就能将这个可能性和我们隨机预期的可能性进行比较，并 
进一步得出推论结论。在《爱上统计学》第 IV 部分的开始，我们将这个模型应用 
到检验差异性问题的特定案例中。 • 
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练习时间 

1 -正态曲线： 

a . 正态曲线的特征是什么？ 

b . 人类的哪些行为、特性或特征的分布是正态的？ 

2. 为什么 z 值是标准化的值？为什么 z 值可以用于比较不同数据分布的 
数值？ 

3. 计算下面的均值为50,标准差为5的数据分布的原始数值的2值。 

a , 55 

b . 50 ， 

c - 60 

cK 57.5 
e * 46 

4 - 问题 4 a 到 4 b 依据均值为75,标准差为 6.38 的数据分布来回答。绘制一 
个简图来确定你需要怎么做。 

a . 一 个数值落在原始数值 *70 和80之间的概率是多少？ 

b . 一个数值落在原始数值80以上的概率是多少？ 

c . 一个数值落在原始数值81和83之间的概率是多少？ 
e . —个数值落在原始数值63以下的概率是多少？ 

练习参考答案 

la . 对于正态曲线，均值、中位数和众数 相等； 曲线是以均值为中心对 称的； 
曲线尾是渐近的。 

lb . 例如身高、体重、智力或问题解决能力。 

2. 因为^值是基于不同数据分布的离散度计算的，所以是标准化的值（可以 
与其他同类型数值比较）。因为 z 值是测量均值和横轴上其他数据点之间的距 
离 （不 论数据分布之间在均值和标准差上的具体差异如何），使用相同的单位 （标 

准差单位），因而他们能够相互比较。 • 

3 a , z — (55 —50 )/5 = + 1 * 00 

3 b.z = (50 -50)/5 =0 

(60 -50)/5 = +2.00 
3 d . z = (57.5 -50)/5 » +1.5 
3 e . z ^(46 -50)/5 = -0.8 

4 a . 一个数值落在原始数值 70 和 80 之间的概率是.5646。原始数值70的 z 
值是- .78 ,80的 2 值是.78。均值与^值 .78 之间曲线覆盖的面积是28, 23% 0 
这两个 2 值之间曲线覆盖的面积是 28. 32% x 2,或56.46%。 

4 b . 一个数值落在原始数值80以上的概率是.2167。原始数值 80的2 值是 
.78。均值与,2值 .78 之间曲线覆盖的面积是28.23%。2值 .78 之下曲线覆盖的 
面积是 .50 +.2833, 或，7833。曲线覆盖的总面积1和 - 7833之间的差是. 2167, 
或21,67%。 

4^ 一个数值落在原始数值81和83之间的概率是+068。原始数值81 的 z 
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值是.94,83的2值是1.25。 均值与 z 值，94之间曲线覆盖的面积是 32*64%。 均 
值与 z 值 L 25 之 间曲线覆盖的面积是 39.44%。 这两个 z 值之间曲线覆盖的面 
积是. 3944 〜 3264 = . 068 ，或者 6. 8% 。 

4 e . —个数值落在原始数值63以下的概率是.03。原始数值63的 z 值是 
-1.88。均值与 z 值 -1.88 之间曲线覆盖的面积是 46. 99%。 z 值 - 1 . 88之下曲 
线覆盖的面积是1 -(.50+.4699) =.03,或者3%。 






第 IV 部分 


s s 性蓋 s ■ 
馑珥 筏论 莼卄 


你已经学到这里，而且仍然充满活力，所以要恭喜你。到现在为止，你已经 
很好地掌握了描述统计是什么，偶然性因素在决策中如何影响结果，以及由于偶 
然性因素和处理方法的不同，结果出现的可能性是如何的。 

你是建立和理解假设在社会和行为科学研究中所扮演的角色的专家。现在 
就是实践的时候了。让我们看看在《爱上统计学》接下来的部分会学到什么。最 
重要的是你曾经付出的努力会以理解具体的问题而得到快速的补偿。 

这部分的主要内容是理解和应用特定的统计类型来回答特定类型的研究问 
题。我们会介绍最常用的统计检验，也介绍一些稍微复杂的统计检验类型。在 
最后部分会介绍一些比较常用的统计软件包，这些统计软件包可用于计算那些 
我们用老式的计算软件计算的相同的值。 

我们以显著性概念的简短讨论开始，然后逐步演示推论统计。接着就是特 
定检验的案例。这一章需要动手的内容挺多，现在就开始吧。 


显著性的 M 苦 
对你我来说意味着什么 




• 显著性的概念和显著性的重要性 
• 第一类错误和第二类错误的重要性和两者之间的区别 
• 如何进行推论统计 

• 如何为了一定的目的选择适当的统计检验 


显著性的概念 


对于初学统计学的学生来说4能没有哪-个概念或词汇比统计显著 
性更让人迷惑了。但是，对你来说这并不意味着事实就是如此。虽然统计 
显著性是非常有影响的概念，但是也很简单，基础统计学课上的任何学生 
都可以理解。 

我们需要用研究案例来说明我们总结的要点。例如达科特和理査德 
( E . Ducketl & M . Richard ) 的 4 ‘单亲母亲家庭中母亲的职业和青少年的日 
常*经验 （ Maternal Employment and Young Adolescents * Daily Experiences in 
Single-Moiiier Families ) "( 1989 年密苏里州堪萨斯，儿童发展研究协会论 
文）。他们调査了 436 个 5 年级到 9 年级的肯少年对母亲就业的态度。 

特別的是他们调查了母亲有工作和没工作的青少年在态度上是否存 
在差异。他们也检验了其他因素，但是就这个案例来说，我们关注的是有 
I :作的母亲和没有工作的母亲之间的群体差异。再加一项内容就是在是 
否存在差异的讨论中增加显著性，因此我们的研究假设类似如下的 陈述： 

依据情绪状态的测量，母亲工作和不工作的青少年对母亲就业的态度 

具有显著性差异。 

我们所说的显著性的含义是指两个群体的态度之间的任何差异是由 
于系统因素的影响而不是偶然性因素。在这个案例中，影响因素是母亲是 
否工作。我们假定控制了可能影响两个群体之间差 舁的所 有其他因素。 
因此，余下的解释青少年态度差异的唯一因素就是母亲是否 I :作。这就是 
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正确的解释？是的，但是还不完全。 

是否 只有成们是 c 美的 . 

我们的世界并不完美，所以我们在一定程度上确信我们确定的引起群 
体间差异的那些因素时要留有余地。换句话说，你需要表明即使你很确信 
两个青少年群体之间的差异是由 j 1 母亲的就业状态引起的，但是你不能 
100%、绝对地、肯定地、无可置疑或毫不含糊地确信这一点。你的结论是 
错误的可能性始终存在，不论这个可能性多小。 

为什么？原因很多。例如，有可能你的结论完全错误。4许在这次研 
究中，青少年的态度差异不是由于母亲工作或不工作引起的，而是由于其 
他没有注意到的解释因素，例如地方就业母亲俱乐部举办的演讲，一些学 
生加人了这样的俱乐部。如果 一个青 少年群体的成员几乎都是男性而另 
-- 个青少年群体的成员几乎都是女性的情况下又该是怎样的结论？这也 
可能是差异的来源。如果你是优秀的研究者也进行了一定的研究，你可以 
解释差异，但是总有可能你做不岀解释。作为优秀的研究者你必须考虑这 
种可能性的存在。 

那么你要怎么做？在大多数涉及假设检验（例如这里的案例中的群 
体差异）的科学研究中一定存在一定数 M 的不能控制的误差一~ - 这也是 
前面几章已经讨论过的偶然性因素。你愿意承抱的风险水 t 或者概率水 
平就是显著水平，这个词不会给人们带来内心的恐惧。 

显著水平 （significance level ,这里是快捷简单的定义）是不能100%确 

信实验屮观察到的结果是由于处理因素或需要检验的因素引起的——在 

我们的案例中是母亲是否工作*-商 1 要承担的风险^如果你看到的陈述 

是显著性结论是在 . 05概率水平下 （ 或者更专业的说 p < . 05，在专业期刊 
中你会经常看到），换句话说就是 2 0次中有1次（或 .05 ,或5% )所发现的 
任何差异不是由于假定的原因 （ 母亲是帝 1. 作），而是由于其他未知的原 
因引起的。你的工作就是尽可能减少这种可能性，消除所可能引起观察 
到的任何差异的其他原因。因为你不可能完全消除这种可能性 （ 因为没 
有人能够控制所有潜在的因素），必须分配一定的概率水平，并谨慎地陈 
述结论。 

总之（实际上也是如此），研究者定义了他或者她愿意承担的风险水 
平。如果结果落在这个范围内，也就是说“这不是偶然出现的^——而是有 
其他因素在产也影响”，研究者就会知道零假设 （ 表达式是等式）不是观察 

到的结果的最有力的解释。相反研究假设 （ 也就是说是不等式，或者说存 
在差异）是可选择的解释。 

现在来看另一个案例，这是假设的案例。 

研究者有兴趣了解参与学前项目的孩子与没有参与的孩子在学习成 
绩上是否存在差异。零假设是两个群体的学习成绩相等。 
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研究假设是参与学前项目的孩子的平均成绩高于没有参与项目的孩 
子的平均成绩。 

作为一个优秀的研堯者，你的工作就是表明（尽你所能——没有人可 
以完美地解释任何事物）两个群体之间存在的任何差异仅仅是由于学前 
项目的影响，而不是任何其他因素或者因素的组合。你可以使用一些技术 
(你会在高一级的统计学课程中 学习） 控制或者消除影响差异的所有可能 
的原因，如父母教育水平、家中孩子的数量等的影响。一旦消除了其他潜 
在的解释变量，唯一留下的对差异的解释就是学前经验的影响。 

但是你可以绝对地确定吗？不，你不可以。为什么？首先，你不能确 
定你所研究的样本能够很好地代表总体。而 R 即使样本能很好地代表总 
体，也总是存在影响结论的影响因素，而且在设计试验的过程中你总会无 
意中遗漏这些因素。研究中始终存在错误的司能性。 

如果推断考试成绩的差异是由于经历的不同，就得接受一定的风险。 
实际上 （ 给点掌声鼓励）风险水平就是你愿意执行的统计显著性水平。 

统计显著性 （statistical significance ,这里是正式的定义）是指零假设为 

真的情况下拒绝零假设所要承担的风险水平。就上面的例子来说，零假设 
是两个样本群体之间没有差异（记住，零假设始终以等式的形式表述 K 
但是在给你们的数据中，你们会发现差异确实存在。也就是考虑到目前你 
们找到的证据的情况下，群体成员的身份似乎对学习成绩有影响。但是在 
真实的世界中却可能没有差异。如果你拒绝了你陈述的零假设，你就犯了 
一个错误。犯此类错误你可能承担的风险（或者说显著水平）就是人们熟 
知的第一类错误^ 

世界上最重要的表格 （ 只对这一学期而 言） 

下面是简要的概括。 

零假设可能是真实的也可能是虚假的。两个群体之间可能真的没有 
差异，也可能真的确实是不相等的（如两个群体之间存在差异）。但是要 
记住你永远不会知道真实的状况，因为零假设不能直接检验（记住零假设 
只应用于总体）。 

实际上，作为优秀的统计学者你既可以选择拒绝也可以接受零假设， 
对吧？ 一 共有四种情况，你可以在表 8.1 中看到。 

现在就来看看表中的每一格。 

共于表 8.1 与 表更多 的讨抡 

表 8. 1中的四个重要的格描述了零假设的性质（真实的或虚假的）和 
相应的选择（接受或拒绝零假设）之间的关系。就如你能看到的，零假设 
可能是真实的也可能是虚假的，而你可能拒绝也可能接受它。 

对于理解这个表來说最重要的事实是研究者永远不知道零假设的真 
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实性质，以及群体之间真的存在或者不存在差异。为什么？因为总体（零 
假设所表示的）不能直接检验。为什么？这样做是不现实的，而这也是为 
什么我们有推论统计。 

表 8.1 不同类型的错误 


可能的选择 

接受零假设 拒绝零假设 


零假设是 
真实的 


零假设的 
真实性质 

零假设是 
虚假的 


©对啦 f 零假设是真实的情 
况下你接受了零假设，而且 
群体之间没有差别。 


3 

哦一你犯了第二类错误，接 
受了虚假的零假设。第二 
类错误也4以用希腊字母 
贝塔，或表示。 


2 

哎一你犯了第一类错误， 
在群体之间没有差异的情 
况下拒绝了零假设 D 第一 
类错误也可以用希腊字母 
阿拉法，或0£表示 
4 

©很好，在群体之间存在 
差异的情况下你拒绝了零 
假设。也可以叫做检定 
力，或1 - P 。 


•表 8# 1 中格子1表示的状况是，零假设是真实的(群体之间没有差 
异）情况下研究者做出了接受的正确选择。这里没有问题。在我 
们的案例中，我们的结论表明两个孩子群体之间没有差异，而我们 
接受 r 零假设也就是没有差异的正确选择 □ 

• 格子 2 表示的是严重的错误。这里我们拒绝了零假设（也就是没有 
差异），而零假设实际上是真实的 （ 即没有差 异）。 两个孩子群体之 
间没有差异，但是我们得出的结论是有差异，这是一种类型的错误。 
这就是人们所说的第 一 类错误 （Type I error ) ， 也就是显界水 f 1 。 
•还存在一类错误。格子3也表示一种严重的错误。这里我们已经 
接受了零假设（也就是没有差异），而零假设实际上是虚假的 （ 即实 
际上存在差异）。我们已经说过两个孩子群体之间有差异，但是我 
们得出的结论是没有差异。很明显这就是人们熟知的第二类错误 

(Type II error ) □ 

•表 8. 1 屮的格子 4 表示的状况是在零假设实际上是虚假的情况下， 
研究者做出了拒绝的正确决定。这里没有问题^在我们的案例中， 
我们的结论表明两个孩子群体之间有差异，而且我们做出了拒绝表 
述为没有差异的零假设的正确选择 D 
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万卷 I ' 



如果 .05 是好的，那么 .01 更好，为什么不把第一类错误的风 
险水平定在._001?对于每一个好的解释来说，有时你如此严谨 
地拒绝虚假的零假设以至于会错过了正确的零假设。这样严格的 
第一类错误的发生率留下的余地很小——实际上研究假设可能是 
正确的，但是相应的概率水平是 .015 ——非常少见，但是由于严格 
的第一类错误而错过了。 


同额第一类错访 

我们现在把重点更多地放在格子2匕也就是犯了第一类错误，因为 
这是我们讨论的重点。 

第一类错误或者说显著水平具有特定的值，而丨 L 与任何零假设检验中 
定义的你愿意承担的风险联系在一起。一般设置的显著水平是在,01与 
.05 之间。 

例如，如果显著水平是 .01 ，这意味着在任何一个零假设检验中，只有 
的可能性是零假设为真，而你拒绝了零假设，并 R 在群体之间实际上根 
本没有差异的情况下得出群体之间有差异的结论。 

如果显箸水平是 .05 ，这意味着/|:任何一个零假设检验中，只有5%的 
可能性是零假设为真，而你拒绝了零假设 （并 得出群体之间有差异的结 
论），而实际上根本没有群体间差异。要注意的是显著水平与零假设的独 
立性检验相关，而且不可以说“对零假设的100次检验中我犯了 5次或总 
数中5%的错误。” 

在最近的研究报告中，统计显著性通常以 p < . 05表示，可以读作“观 
察到这种结果的概率 小于. 05”，在专业文章的报告中简单地表述为“在 
-05 的显著水平下。” 



依据很流行的统计分析软件的介绍，就不再需要担心这样的 
陈述如 “P <• 05”或> <• 0 K 的不准确性 —— p <• 05就意味着是 
从 .000 到. 049999的所有值吗？但是类似 SPSS 的软件给出了你 
犯第一类错误愿意承担的风险的确定的概率如 p = . 0!3,或者 p = 

• 158。因此当你在研究报告中看到类似的陈述如 “p <. 05” 时，意 
味着 P 值是从 • 00到. 049999999999之间的任何值 （ 你会明白的）。 
同样的，当你看到 “P >. 05” 或“/> ”（非显著性），意味着拒绝 

真实的零假设的概率 超过. 05,实际上可能性范围是. 0500001 
到 1.00 o 


因此，知道一个结果的确定的概率是很大的进步，因为我们能 
够更准确地测量我们愿意承担的风险。 
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在第一类错误之外，你还可能犯另一类型的错误，如在表 8 . 1 中所示 
当你无意中接受了虚假的零假设就产生了第二类错误 （ 表中的格子 3) 。 



当我们讨论一项发现的显著性时，你可能听到检定力这个词 
的使用。检定力是关于统计检验如何很好检验和拒绝一个虚假的 
黎假设的概念。从数学上来说，检定力就是用】减去第二类错误 
的值。更有检定力的检验总是比相对没有检定力的检验更具有吸 
引力，因为更有检定力的检验可以让你更接近辨别虚假的核心。 


例如，样本群体代表的两个总体之间存在真实的差异，但是你错误地 
得出差异不存在的结论。 . 

就理想状态而言，你想同时减少第一类错误和第二类错误，但是这总 
是很难实现，或很难控制。你已经完全控制了第一类错误的水平或者说你 
愿意承担一定的风险 （ 因为你实际上设置丫风险水平）第二类错误没有 
直接控制，但是第二类错误与样本规模等因素相关。第二类错误对样本中 
个体的 数量特 别敏感，当个体数量增加时，第二类错误就越低。换句话说， 
样本的特征越是与总体的特征匹配（可以通过增加样本的规模提高 ） ，你 
接受虚假的零假设的可能性就越低。 ' 


显著性与意义 


对研究者来说，有趣的状况是发现试验的结果在统计 i •.是显著的。你 
知道统计显著性的含义——也就是研究在统计上成功了，而且零假设不是 
发现结果的合理解释。现在，如果你的实验设计和其他因素都经过谨慎的 
考虑，统计上显著的结论无可怀疑使你在研究领域做出贡献迈出了第一 
步。但是，统计显著性的值和其重要性或意义必须认真考虑。 

例如，我们面对的情况是将规模非常大的不识字的成年人（大概 
10 000人）样本分成两组。一组通过使用电脑来接受集中的阅读训练，另 
外的一组通过课堂教学来接受集中的阅读训练。组 1( 在课堂中学习）的 
阅读测验的尹均成绩,也就是被解释变最是7 5 . 6 •组2 ( 使用电脑学习）的 
平均成绩是 75. 7。两组的方差的数量几乎相等。就如你所能看到的，成 
绩均值的差异只有十分之一点（乃.6与 75.7) ，但是对独立均值之间的显 
著性进行£检验时，结果在 . 01的水平是显箸的，这表明电脑学习者比教室 


教学学习者学得更好。 （ 接下来的两章讨论 t 检验） 

两组之间 0.1 的差异实际上是统计显著的，但是是否有意义？考试成 
绩（在这么小的范围内）的提高是否能够为花费300 000美元建立这个项 
目提供充分的合理解释？或者说这个差异无足轻重可以忽略，即使在统计 


h 是显著的？ 

下面列岀的是我们依据这个案例和其他许多可能的案例得出的有关 




106 :万卷方分 爱上统计学 

’统计显著性的重要性的结论。 

•统计显著性本身或内部是无意义的，除非所执行的研究具荷合理的 
概念基础，可以由此推导结果显著性的意义。 

• 统计显著性不能脱离发生的背景独立地解释^例如，如果你是学校 
系统的管理者，如果留级项目以半分之差显著地提高学生的标准化 
考试成绩,你是否愿意将学生留在一年级？ 

•虽然统计学是很重要的概念，但不是终极 g 标，当然也不应该是统 
计研究的唯一目标。这就是为什么我们以检验假设开始而不是证 
明假设。如果我们的研究设计正确，那么甚至零假设也会揭示重要 
的信息。如果特定的处理闲素没有产生影响，这也是其他人需要知 
道的重要信息。如果你的研究设计得很好，接着你应该知道为什么 
处理因素没有发挥作用，那么沿着这条线研究的其他人在设计他或 
者她的研究时就可以考虑你所提供的有价值的信息。 

推论统计介绍 

描述统计是用于描述样本的特征，而推论统计是基于样本特征推断总 
体的某些特征。 

在《爱 h 统计学》前半部分的几个方面，我们已经强调，好的科学研究 
的一个标志就是以这样的方式选择样本，也就是样本是从中选择样木的总 
体的代表。接着的过程就是推论，就是基于样火的检验（和试验）结果从 
较小的样本群体推断较大的群体。 

在我们开始讨论具体的推论检验之前，先了解推论方法应用的逻辑。 

推■如何遗行 

下面是研究项目的一般步骤，可以了解推论如何进行。我们仍然以青 
少年对母亲工作的态度作为案例。 

下面是事件可能发生的次序。 

1. 研究者从母亲 I :作的青少年和母亲不工作的靑少年中选择代表性 
样本。样本选择的方式是样本能够代表从中选择的总体。 

2. 每一个青少年要进行一次测试来评价他或她的态度。接着计算群 
体的均值并使用 一 些检验方法来比较。 

3- 可以得出的结论是成绩之间的差异是由于偶然性因素（也就是母 
亲工作之外的一些因素是差异的原因）引起，或是由于群体之间“真实的” 
以及统计显著的差异引起（也就是由于母亲工作）。 

4,司以得岀的结论是从中选择样本的总体中母亲就业和青少年态度 
之间的关系。换句话说，基于样本数据分析所得结论进行的推论是关于青 
少年总体的。 
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如何选择用于格验的方法 

f :面的第三步让我们提出这个问题，“我如何选择恰当的统计检验来 
确定群体之间的差异是否存在? ”检验方法太多了，你必须决定使用哪一 
种以及何时使用。如何使用哪一种检验的最好的学习方式是成为有经验 
的统计学者——选修过许多这个领域的课程而且参与了许多研究。经验 
7欠远是最好的老师。实际上没什 么真」 I 〔的学习选用哪一种以及何时使用 
的7/式.除非你具有真实的实际应用这些工具的机会。因此 I :这门课你就 
在学习如何使用这些特定的工具。 

因此，为 r 实现我们 h 的并开始学习，我们建立了各种工具的简易流 
程表（或速.查表)，如图 8. 1所示。你必须知道你在做什么，这样选择正确 
的统计检验就不完全是随意的决定，当然也是很好的开始学习的起点。 

' 不要认为图 8.1 可以满足你学习不间的检验何时是恰当的需要。这 
里的流程表只是帮助你开始学习。 

如何使用洗程表 




i 一假定你是刚人门的统计人员（实际上也是），对显著性检验有一 
定的了解，但是对于何时使用哪一种很迷惑。 

2— 回答流程表上部的问题。 

3 — 依据对流程表每一个问题的回答进行选择，直到流程表的末 
端。那就是你应该选用的统计检验。这不是火箭科学，而且经 
过一些实践 （ 你可以通过本书的这一部分来实践），你就能够1^： 
速有效地选择恰当的检验。本书这一部分的每一章都会以类 
似图 8. 1中所见的流程表开始，让你经过特定的步骤选择应该 
使用的统计检验。 





7 且你熟悉了你離领域的研^ 


3 • A : :，:： ■ ^ ^ :窣:、，: " i : 

担是图 8 J 列出了最 




V 图《:1中的简易流程表是否包含所有的统计检验？当然 
不是全部。大约有上百种统计检验方法一一 … 一 
常用的:3厂 

其中几种检验万法^ ， 

wn : •: :？ 




^ “• 仏 人 





显著性检验介绍 


推论统计的优势就是可以依据样本的信息得出关于总体的结论。进 
行推论的最有用的工具之一就是统计显著性检验，显著性检验可以依据所 
提问题的性质和零假设的形式而应用于不同的情形。 




























爰上统计学 


rQC 函 
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例如，你是否想了解两个群体之间的差异，如男孩的某些考试的成绩 
是否与女孩的成缋有显著差别？或者是两个变 S 之间的关系，如一个家庭 
中孩子的数量和智力测试的平均成绩？这两个案例需要不同的方法，但是 
两者最后都会使用特定的统计显著性检验对零假设进行检验。 

如何进行显著性栓验 ：计釗 

显著性检验是基于这样的事实，每一类塑的零假设都与特定的统计类 
型联系在一起。而每一种统计类型与特定的分布联系在一起，你要比较从 
样本获得的数据的分布。依据样本特征与检验的分布特征的比较你可以 
推断样本特征是否不同于预期的随机分布特征。 

下面是任何零假设进行统计检验时需要采用的一般步骤。这些步骤 
也是第 IV 部分各章的模式。 

1. 零假设的陈述。你是否记得零假设的陈述形式是等式？零假设是 
假定没有其他影响判断的信息的情况下事件的“真实”状态。 

2. 设置零假设的风险水平（或者显著水平，或第一类错误）。任何研 
究假设都要设置你可能错误的特定风险水平。第一类错误越小（如 • 01 
与 .05 相比），你愿意承担的风险越小。没有假设检验是完全没有风险的， 
因为你永远不会知道两个变 S 之间的“真实”关系。要记住按惯例第一类 
错误设置的概率水平是 .01 或 .0 5 ;SPSS 和其他软件设定相同的概率水平。 

3. 选择恰当的检验统计量。每一个零假设伴随着特定的检验统计量。 
在本书的这部分你可以知道什么样的检验与什么样的问题类型相联系。 

4. 计博检验统计值。检验统计值（也叫实际值）是特定的统计检验的 
结果。例如，两个群体的平均值之间差异的显著性，相关系数与0值之间 
差异的显著性,两个比例值之间差异的显著性，都需要进行统计检验，得到 
一个具体的数值。 

5. 使用特定统计量的统计临界值表确定拒绝零假设需要的值。每一 
个检验统计暈（同时考虑群体规模和愿意承担的风险）都有相应的临界 
值。这个值是零假设，是真实的情况下你预期的拒绝零假设的统计检 

验值。 

6. 比较实际值和临界值。这是关键的一步。就是比较通过检验统计 
量获得的值（你计算所得的值）与你预期的随机的情况下对应的值（临界 

值） 。 

7 . 如果实际值大于临界值，不能接受零假设。也就是说，零假设的等 
式陈述（反映偶然性）不是我们发现的差异的最有力的解释。这也是推论 
方法表现出其优点的地方。只有实际值大于随机状态对应的值（也就是 
统计检验的结果不是随机变动的结果）你才可以说你发现的任何差异不 
是随机结果，且零假设的等式陈述不是解释你发现的任何差异的最有力的 
解释^相反，差异一定是由于处理因素引起。 
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8. 如果实际值没有超过临界值，零假设是最有力的解释^如果你不能 
表明你发现的差异是由于偶然因素之外的因素（如处理因素）引起，那么 

差异一定是由于偶然因素或者其他你没有控制的因素引起。换句话说,零 
假设是最好的解释 

—张固胜过千 t 万语 

在图 8. 2中你可以看到我们刚才学习的八个步骤的表述。这是实际 

值和临界值比较时不同情况的图形表示。在这个案例中，显著水平设置 
为 -05 或说5%。也可以设置为,01或1%。 



图 8.2 比较实际值和临界值，并作出拒绝或者接受零假设的决定 

整个曲线表示基于特定零假设一 一 


如两个群体之间的差异或相关 


系数的显著性 


的所有可能的结果 


2-临界值是这样的点，即超过这个点的实际结果如此稀少，因此可以 
推断实际结果不是由于偶然因素而是由于其他因素引起的。在这个案例 
中，我们定义的稀少程度是发生的可能性不足5%。 

3. 如果结果表示实际值落在临界值的 A •:边（就是小于极值），结论就 
是零假设是观察到的任何差异的最有力的解释。换句话说，实际值落在这 
个范围 （ 曲线下面积的95% ) ，我们只能推测结果是由于偶然因素引起的。 

4. 如果实际值落在临界值的右边（就是大于极值），结论就是研究假 
设是观察到的任何差异的最有力的解释。换句话说,实际值落在送个范围 

(曲线下面积的5% ) ，我们只能推测结果是由于偶然因素之外的因素引 
起的。 



小结 


现在你已经明确地 了解了 显著性概念如何应用，余下的工作就是将显著性 
概念应用到不同的研究问题中。这也是下一章开始的内容，也会在本书这一部 
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分的大部分章节中继续。 

练习时间 

1. 为什么显著性是研究和应用推论统计的重要概念？ 

2. 下面的陈述有什么问题？ 

a . 第一类错误是 .05 意味着100次中有5次我会拒绝真实的零假设。 

b . 将第一类错误设置为0是可能的。 

c . 第一类错误的概率水平越小，结果越好。 

3. 偶然性为何与研究假设的显著性检验有关？ 

练习参考答案 

1. 显著性概念是研究和应用推论统计的关键，因为显著性（反应到显著水平 
方面）设置了我们确信我们观察的结果是“真实”的水平，以及在多大程度上这些 
结果可以一般化到从中选择样本的更大的群体。 

2 a . 显著永平只用于单一的、独立的零假设检验，而不是多元检验。 

2 b . 不可能将第一类错误的概率水平设置为0,因为我们可能在零假设实际 
上是真实的情况下拒绝零假设。这种可能性总是存在。 

2 c . 零假设是真实的情况下拒绝零假设你愿意承担的风险水平，与研究结果 
的意义没有关系。你可能得到显著水平很高的结果，但是没有意义，或者第一类 
错误的概率水平很高 （.10) ，却是很有意义的发现。 

3. 偶然性反映在可能拒绝真实~零假设时你愿意承担的风险水平（第一类 
错误）中。 * 



两个群体的 £ 检验 
不 M 群休的均值检验 




• 何时使用独立均值的 < 检验 
• 如何计算观察值/值 
• 解释 f 值，理解 f 值的含义 


独立样本£检验介绍 

即使饮食紊乱因为其严重性得到关注，也很少进行跨文化的症状的盛 

行程度和严重性的比较研究 a 约翰.舍斯泰特、约翰.舒马克与纳特沃特 
(John P . Sjosledtjohn f . Shumaker & S . S . Nathavvat ) 对 297 个澳大利亚大 

学生和 249 个印度大学生进行/这项比较研究。每个学生都参加了饮食 
态度测试和戈德法布肥胖恐惧 M 表测试^然后比较群体得分。就澳大利 
亚学生和印度学生的均值比较而言，印度学生的两个测试的得分都高于澳 
大利亚学生。饮食态度测试的结果是= -4. 19 ,p < .000 1 ,戈德法布 
肥胖恐惧量的测试结果是 t i44 = - 7. 64 / < . 000 1。 

那么，结果意味着什么？接着往下读^ 

为什么《检验用于独立均值？舍斯泰特和他的同事的兴趣在于发现 
两个相互独立的群体在一个（或多个）变量的平均值上是否有差异。我们 
所指的独立性的含义是两个群体在仟何方面都不相关。研究中的每一个 
参与者只接受一次测试 O 研究若采用独立均值的 i 检验，依据对每一个结 
果变量得出的结论，两个群体之间的差异在等于和小于 .000 1的显著水平 
K 是显著的。迭么小的第一类错误意味着两个群体得分的差异是由群体 
成员本身之外的因素引起的几率非常小，在这个案例中群体本身的因素是 
指民族、文化或者种族。 

是否想了解更多？查阅约翰_舍斯泰特、约翰 • 舒马克与纳特沃特 
( Sjostedt , J . P . , Shumaker , J . F , & Nathawat , S . S . )1998 年发表在《社会心 

理学杂志》 （ # Social Psychology ) 138期第3卷351 ~ 357页上的文 



9 两个群体的 t 检验——不同群体的均值检验 113 

章“印度大学生和澳大利亚大学生的饮食紊乱调查 （ Ealin s disorders among 
Indian and Austrailian university student )’’。 

知识和智识路径 

K 面介绍如何使用图 9.1 所示的第8章已经介绍的流程表选择合适的 
统计检验，也就是独立均值的 i 检验。沿着图 9. 1中加黑的步骤就可以。 



1 一 研究澳大利亚学生和印度学生之间差异。 

2— 每一个参与者只被测试一次。 

3 — 有两个群体。 

4 一合适的统计检验是独立均值的 f 检验。 





儿乎每一个统计检验都有特定的假设支持检验的使用。炉 j 
如“检验的一个主要的假设是两个群体中每个群体的变化的量是 
相等的。这是方差齐性假定。如果样本规模足够大就会破坏这个 
假定，小样本或者假定的破坏都可能导致自相矛盾的结果和结论。 
你不需要太担心这些假定，因为这些内容已经超过了本书的范围。 
不过，你应该知道这样的假定很少被破坏，但这种可能确实存在。 


计算检验统计量 


公式 9. 1是计算独立均值 f 检验中 f 值的公式。公式的分子是均值之 
间的差。群体内和群体之间的变化的数量构成分母。 





其中一 

X , 表示群体1的均值 

瓦表示群体2的均值 
~表示群体1中参与者的数 M 
%表示群体2中参与者的数量 
5?表示群体1的方差 
4表示群体2的方差 

公式中没有新的内容。重要的只是代入正确 的值。 

下面的数据是帮助老年痴呆症患者记住口常生活秩序而设计的项目 
中能够记住的单词的数 M 。 群体1是使用视觉教学，群体2使用视觉教学 
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和发声训练。我们使用这些数据计算下面案例的检验统计量 


群体1 • 群体2 



5 

4 

6 
10 
10 

5 
I 
1 

4 



5 

7 

1 

9 

2 

5 

2 

12 

15 

4 



下面是著名的八个步骤和《检验统计量的计算。 

1. 零假设和研究假设的表述。如公式 9. 2所示，零假设表示群体1和 
群体2的均值之间没有差异^就我们的目的而言，研究假设（公式 9. 3所 
示)表示两个群体的均值之间有差异。研究假设是双侧的无方向假设，因 
为研究假设只是表示差异存在，而没有特定的方向。 

零假设是 

: / a , = fj , 2 (9. 2) 

研究假设是 

H x : X } ^X 2 (9.3) 

2. 设置零假设的风险水平（或显著性水平，或第一类错 误）。 风险水 
平或第一类错误或显著性水平 （ 或其他的称谓 ） 是. 05，这完全由研究者 

决定。 

3. 选择合适的检验统计量。使用图 9.1 所示的流程表，我们确定合适 
的检验方法是独立均值的 f 检验。因为这两个群体相互独立，所以不是非 
独立均值的 f 检验 （ 初学者常犯这个错误）。 

4. 计算检验统计值（也叫做实呩值）。现在我们代人观察值并进行计 
算。公式 9.1 是 r 值公式。代入具体的值之后，我们就得到等式9_ 4 (我们 
已经计算了均值和标准差）。 


5. 43 — 5. 53 



[(30 _ 1)3, 42 2 + (30 -1)2, 06 2 1 

[30 + 30] 


i 30 + 30 - 2 

■ 30 x 30- 


(9.4) 


代人具体的数值之后，公式 9. 5表示我们如何得到最后的值 -.14( 原书此 
处为-.18)。因为是用一个较小的值（群体1的均值是 5. 4 3)减去 一个较 
大的值（群体2的均值是 5. S 3) ，所以这个值是负值。要记住一点，即使检 
验是无方向的，而且任何差异都是假定的，差异的符号也是无意义的。 
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r 339. 20 + [23, 06 


r 60 1 

58 - 




14 


(9.5) 


5. 使用特定的统计量的临界值分布表确定拒绝零假设需要的值。现 
在我们需要査阅附录 B 的表 B 2, 表 B 2 列出了 f 检验的临界值。 

我们可以使用这个数据分布表来看两个独立均值是否不同，这要通过 
比较预期的随机数值（分布表中的值或者临界值）与观察到的值（实际值） 
来实现。 


我们的第 一 个任务是确定自由度 （degrees of freedom , df , 自由度近似 
于样本规模。对目前选定的检验统计摄来说自由度是％ - 1 +化 - 1。因 
此对每一个群体来说，就是将两个样本的规模加起来然后减去2。在这个 
案例中就是30 +30 - 2 = 58 。这是就这类检验统计 M 的自由度，但不是对 
其他统计量也合适。 

使用这个数字 （58) 、你愿意承担的风险水平 （ 早先定义的 . 05 ) 以及双 
侧检验 （ 因为研究假设没有方向），你就可以使用 i 检验表来査找临界值。 
对于显著水平为.05、自由度为58的双侧检验来说，拒绝零假设需要的值 
就是…哦！在分布表中没有自由度58这个数值！你该做什么？如果选择 
对应自由度55的值，你会显得保守，因为你使用了小于现有样木规模的样 
本对应的值 （ 临界值 t 值会变大）。 . 

如果你选择对应自由度 60( 最接近58的值）的值，你会更接近总体规 
模，但是选择60相对于58而言更为随意一些。虽然统计学家对于这种情 
况该怎么做的观点不同，我们通常选择最接近于实际样本规模的值。因此 
在显著水平为, 05、自由度为58的情况下拒绝零假设需要的值是 2. 00〗。 

6. 比较实际值和临界值。实际值是 -• ! 4 ,拒绝零假设也就是群体1 
和群体2取得的成绩没有差异的临界值是 2. 001。临界值 2. 001表示对应 
于这个值， ft 愿意承担的风险水平为 .05、 每个群体 30 个参与者的情况下， 
随机因素是对两个群体之间观察到的任何差异的最有力的解释。 

7•和8•做出决定。现在我们该做出决定丫。如果实际值大于临界值 
(参照图 8. 2) 就不能接受零假设。如果实际值没有超过临界值，零假设就 
是最有力的解释。在这个案例中，实际值（ 14)( 原书为 18) 没有超 
过临界值 （2. 001) ——送个值不够大，我们不能说群体 1 和群体 2 之间的 
差异是由于随机因素之外的因素引起的。如果实际值等于或者大于 
2.001 ，就如投硬币试验中10次有8,9或10次都得到正面一样，这个值太 
大我们不能相信除了随机因素之外其他因素没有发挥 作用。 在投硬币试 
验中，是不均匀的硬币 一- 在这个案例中 ，一 定有其他更好的方法来向老 
年人教授记忆能力。 

那么什么引起两个群体之间这么小的差异？如果我们继续现在的讨 
论,那么可以说差异是由于抽样误差或者对参与者成绩的微小变化的四舍 
五人误差引起的。最重要的是我们可以确信（当然不是100%确信）不是 
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由于任何特定的因素使得一个群体或另一个群体取得更好的成绩。 

外么如何 鮮释卜 58) : . 14 > . 05 

• t 表示我们所用的检验统计量。 

•58 是自由度数值。 . 

• -.14 是实际值，是使用本章之前给出的公式计算所得的值。 

• P > . 05 ( 实际上是这个简短表达式中最重要的部分）表示对零假设 
的任何检验来说，两个群体的差异是由于随机因素 _ 的可能性大于 
5% 。同时注意 p > .05 也以 p = n . s . 的形式出现表示非显著性。 

特殊效 果：差 异是真实的吗 

现在你已经知道如何检验两个不同的群体或者两个独立群体的均值 
差异。很好，但这还不是全部。 

如果你已经知道群体之间具有显著性差异，但是投人 64 000 美元的 
问题不仅仅是差异是否显著，而且是是否有意义的问题。我们的问题是代 
表不同群体的数据分布之间的差异是否足以说明你观察到的差异，以及你 
检验的差异是真实的差异！好吧，现在进入效应量的讨论。 

效应量是对两个群体之间如何相互不同的测 M ——也是对处理规模 
的测童 。 类似于多大才算大。而且计算效应 M 特别有趣的方面是不考虑 
样本规模。计算效应量并且对效应量做出判断是理解显著性结果的全新 
的维度^ 

现在看下面的案例。研究者检验的问题是参与社区自助服务（例如 
扑克牌游戏、野外旅行等）是否提高了美国老年人的生活质量（从1到10 
分为十个等级）。研究者执行了为期六个月的服务项_，在项目期结束之 
后测量两个群体的生活质量（每个群体由 50 名 80 岁以上的老人构成，其 
中一个群体得到服务而另一个没有得到。）下面是结果。 



而且结论是在风险水平 . 034下差异是显著的（也就是 p < . 05 ) 。 

现在，差异是显著的，但是差异的规模是多大？ 

雅各布 • 科亨 （Jacob Cohen ) 是对效应量贡献最大的人，他撰写了有 
关效应量最有影响、最重要的文章。他撰写的一本非常重要非常有影响的 


原朽为教学方式——译者注 





方卷贪 法 


爱上统计学 


书（你的统计学老师的书架上肯定有这本书）可以指导研究者就差#和变 
撤之间的关系提出的不同问题计算效应童。下面是具体介绍。 

讨•算和理解故应量 


与其他统计技术一样，计算效应童（ effect size) 的方式也有多种^我 

们会介绍最简单最直接的方法。你会在我们果会儿就给出的一狴文献中 
对效应量有更多的了解。 


到 fll 前为止，最直接、最简单的计算效应量的方式就是以均值之间的 

差除以 K : 何一个群体的标准差。这样做有一定的风险-因为假定两个 

群体的标准差（和方差）相等。就我们上面的案例来说，我们会这样计算： 



其中 

ES 表示效应量 

X , 表示群体1的均值 

\ 表述群体2的均值 

SD 表示任何一*个群体的标准差 

因此，在我们的案例中， 


Es 一 7* 46 - 6* 90 
^ L 53 

结果等于 . 366,也就是这个案例的效应量是 . 37。 

这意味着什么？科亨等人指出非常重要的一点是效应量的大、中、小 
的范围。他们使用下面的 标准： 

•小效应量的范围是 0.0 20。 

• 中等效应量的范围是 . 20 〜 . 50。 

• 大效应量的范围是 . 50及以上^ 

我们案例的效应量是 • 37 ， 属于中等规模。但是这实际上意味着什么？ 
效应量给我们这样的认识，即每个群体相对于另一个群体的位置。例 
如，如果效应 M 为0,就意味着两个群体非常的相似而且几乎完全重 

叠 - 两个数值分布之间没有差异。另一方面，效应量为1意味着两个群 

体大约有45% ( 通常能达到这个量）重叠。而且，就如你所预期的，效应董 
越大就意味着两个群体重叠的部分越少。 

雅各布*科亨（扣 cob Cohen ) 的《行为科学的统计检定力分析》 （ Smtis - 

tical Power Analysis for the Behavioral Sciences ) , 1967 年的第 1 版和最近的版 
本（1988 ) 可以从 Lawrence Erlbaum Associates 得到，是每一 •个想 了解多 
而不限于这里提供的非常一般的信息的人所必需的。这本书有许多表格 
和技术，可以用于理解为什么统计显著的发现只是分析工作的一半 一 -另 
一半是效应的规模。 
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那么你真的想对效应 鼪了解 更多。你可以通过简单的方式计 
算效应就如我们刚才所展示的（均值相减，然后除以任何一个 
标准差），或者偷看坐卬你旁边的漂亮同学。效应量计算公式的发 
展就是在 h 面的等式的分母（原书为分子） M I 使用综合的方差。 
综合的标准差类似于群体1的标准差和群休2的标准差的平均 
值。公式 如下： 



其中 . 

ES 表示效应量 
X , 表示群体1的均值 

x 2 表示群体2的均值 
erf 表示群体1的方差 
d 表示群体2的方差 

如果我们将上面给出的数宇代人这个公式，就会得到不同效 
应簠 .43 ——与我们使用之前给出的更直接的方法计算所得的效 
应量 .37 差异很大（但是都属于中等规模效应）。但是这是更准确 
的计算方法，大家应该很好地了解。 


非常有用的故应量讨算器 


为什么不搭顺风车盘接登录 http : // www , uccs . edu / — lbecker / psy 590/ 
escalc 3. htm ? 加州大学的统计学家 李 * 贝克尔 （Lee Becker ) 发展 丫 效应 M 
计算器。利用这个计算器，你只要输入数值，点击 compute ， 软件就会完成 
接下来的工作，如图 9.2 所示。谢谢贝克尔博士！ ' 


Group 1 
M^A — 

Group 2 

M 2 \M 

SD t h -03 

SD 2 |1.63 

mrnkif- 

Reset 


Cohen's d 

effect-size r 

|0,3833 E 

0.188 汉 


图 9.2 非常酷的效应置计算器 
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使用计算机进行 t 检验 



SPSS 可以帮助进行推论检验 D 现在就运行我们已经完成的检 

验并对结果进行解释。我们使用的数据集名称是第9章数据集1 
(chapter 9 data set I ) 0 利用这些数据进行练习，你可以看到分组 

变金 t (组1或组 2) 在第一列，检验变量（记忆）在第二列。 





• • 


A ■ i ■ h I I 

Grouping Variable 


■do 




Options... 


.'■r : 


j ..: 


!_在数据编辑栏录入数据或者下载数据文件。要确保有一列为 
分组数据，而且在这一列中只有两个组。 

2 — /存击 Analyze — ► Compare Means 1 ndependeni-Samples I test, 你 

就会看到如图 9. 3 所示的独立样本 z 检验对话框。 


Independenl-SampTes 




T 


rest 






lest VaFfable(s) 






group 


图 9. 3 开始 f 检验分析的对话框 



3 一 点 iti ■变 M group ，然后点击►将变量移到 Grouping Variable ( s ) 
框中。 

4 一 点击变董 memlest ， 然后点击►将变量移到 Test Variable ( s ) 
框中。 

5 —在定义分组变量之前 SPSS 不可以继续运行。这就是告知 SPSS 
变量 group 分成几级（你不会认为软件可以如此智能而发现分 
组层级吧？ ） 。在任何情况下，点击 group ( ?? ) ，点击 Define 
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Groups , 在以叩!键人数值1 , Group 2 键入数值2,如图 9. 4所 

示。在定义之前分组变量的名称（在这个例子中是 group ) 必须 
点中变黑。 



图 9.4 定义组对话框 

6 —点击 Continue ,接着点击 OK , SPSS 就执行分析过程然后得出图 
9.5 所示的结果。 

SPSS 输出结果的含义 

SPSS 的这项分析的输出结果很多，就我们的段的来说，我们只 
要分析图 9. 5所示的结果就可以。有三点需要注意。 

1. 实际的《值是137,非常接近于我们之前手动计算所得的 
值 （-. I 4 )，但是由于四舍五人误差这两个值是不 ㈣ 的。 

2. 自由度数值是 58( 你之前应用公式 - 1 + n t -\ 已得出了 
这个值）。 

3-接下来就是重要的结果。结果的显著性水平是 . 891，或者 
p = . 891，这意味着就零假设的一项检验来说，零假设是真实的情 
况下拒绝零假设的可能性非常高（89% ) !也就是第一类错误肯定 

大于.05,这样我们在应用 P >.05 的公式进行相同的分析时就可 
以及早得出结论。 



小结 


1 检验是进行真实的统计检验，并从应用的角度完整地理解显著性的第一 
步。在进一步深入学习之前要确定你理解本章的内容。而且可以手动完成我们 
要求做到的一些计算。接下来我们学习相同检验的另外一种形式，不过这项检 

验是对同一个参与者群体进行两次测量而不是对不同的两个群体各进行一次 
测量。 * 

练习时间 

1 •使用名称为第9章数据集2 ( chapter 9 data 2) 的数据文件，在 .05 的显著水 
平下检验研究假设，也就是在课堂上男生比女生更经常举手。使用计算器手动 
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完成这次练习。那么就研究假设你得出的结论是什么？记住首先要确定这是单 
侧还是双侧检验。 

2. 使用相同的数据集（第9章数据集2)，在 .01 的显著水平下检验研究假 
设，也就是在课堂上男生和女生举手的次数不同。使用计算器手动完成这次练 
习。那么就研究假设你得出的结论是什么？你使用的数据和问题1使用的数据 
相同，但是假设不同（一个是有方向的另一个是无方向的）。那么结果会有何不 
同？为什么？ 

3. 使用名称为第9章数据集3 ( chapter 9 data 3 ) 的数据文件，检验零假设，也 
就是农村居民和城市居民对待武器控制的态度相同。使用 SPSS 完成对这个问 
题的分析。 


练习参考答案 

1. 男生举手次数的均值是 7. 93,女生的均值是5.31。实际£值是 3. 006,在 
.05 的显著水平下单侧检验（是男生举手次数多于女生）拒绝零假设的临界 i 值 
是1.701。那么结论是什么？男生举手次数多，在统计上是显著的。 

2. 现在的问题更有趣。我们有完全相同的数据，但是假设却不同。现在的 
假设是举手次数是不同的（而不是多或者少），所以需要进行双侧检验。因此使 
用附录表 B 2, 在 .01 的显著水平下双侧检验的临界值是 4 67。实际值 3.006 
(与分析问题 > 所得结果相同）超过了我们的随机预期值，而且就这个假设而言， 
男生和女生的举手次数不同。因此两项检验比较而言，使用相同的数据得出相 
同的结论（接受研究假设）情况下单侧检验的结果（见问题1 ) 不需要和双侧检验 

结果一样。 

3. SPSS 的输出结果如图 9.6 所示，农村居民和城市居民对待武器控制的态 
度没有显著性差异 （P = . 253)。 
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两个群体的 i 检验 
——两个相关{财本的均值检验 



何时使用非独立均值的 Z 检验 
如何计算观察值 i 值 
解释/值，理解 t 值的含义 


# 


_ 


如何给孩子提供最好的教育很明显是任何社会都面对 的重要 问题之 
一。 孩子之间差异太大，所以不得不在满足整体的基本需求和保证特殊的 
孩子（差异连续体的两端）得到他们需要的机会之间寻求平衡。阅读显然 
是教育过程中重要的部分，阿拉巴马大学的三位教授研究阅读资料和常规 

教学对有学习障碍的孩子的阅读能力的影响。雷尼塔 • 古德曼、加里•萨 
普与女 ■ 舒梅特 • 福斯特 （Menitta Goldman , Gary L . Sapp , & Ann Shumate 

Foster ) 发现，大体上来说，对阅读资料和课堂教学给予一年的日常指导在 
阅读成绩提髙方面没有差异。通过对阅读资料这一组前测试和后测试的 
特定比较，他们发现& = 1 . 23，/> > . 05。在项目的最初，阅读资料组的孩子 
的阅读成绩是85_ 5。在项目的最后阅读资料组的孩子的阅读成绩是 
88.5 ——有差异，但是差异不显著。 

为什么用非独立均值检验？ 独立均值检验表明是相同的群体在两 
种不同的条件 K 进行相同的研究。在这个案例中，条件是实验前和实验结 
朿后。首要的原因是相同的孩子测试两次，也就是在1年期项目彡 r •始之前 
和1年期项目结束之后，所以我们使用非独立均值检验。依据上面的结果 
你可以知道，在项目前和项目后阅读成绩没有差异。 f 值 （ 1 • 23 ) 非常小， 
没有落介:我们拒绝零假设的值域范围之外。换句话说，变化太小，我们不 

能说变化是由随机因素之外的因素引起。这么小的差异- 2. 7(88.5 - 

85. 8) 可能是由于抽样误差或者组内的变化引起。 

是否想了解更多？查阅古德曼、萨普和福斯特 （ Goldman ,!*. , Sapp , 




蜃 
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c * L ，& Foster , a , s , ) 1998 年发表在《感知与运动技能》（/ Vrcephm / and Mo - 
tor 泓此 ）86 期 192 〜 19 4 页上的文章“学习障碍学生在阅读资料和常规课 
堂教学中阅读能力的提高 （Reading achievement by learning disabled student 
in resource and regular classes ) ^ 0 

知识和智识路径 

下面介绍如何使用流程表选择合适的统计检验，也就是非独立均值的 
«检验。沿着图 10.1 中加黑的步骤就可以。 



1 一学 生的项目前测试和项目后测试成绩的差异是关注的重点 
2 一每 一个参与者接受不止一次的测试。 

3 —有两个群体。 

4—合适的统计检验方法是非独立均值的；检验。 


计算检验统计量 . 

非独立均值 f 检验包含每一群体均值的比较，而且重点是不同数值之 
间的差异。就如公式 10. 1所示，两次测试的差异总和构成分子，表示群体 
之间的差异。 



其中 


表示群体间差异的总和 - 

X Dl 表示群体间差异的平方和 
n 表示成对观察的参与者数 M 

下面用一些数据说明 f 值如何计算。就如上面给出的例子一样列出 
前测试和后测试结果，而且为了解释的需要假定这是阅读项目前和后的 
成绩。 

下面是著名的八个步骤和《检验统计量的计算。 

1•零假设和研究假设的表述。零假设表示前测试和后测试的阅读成 
绩均值之间没有差异。研究假设是单侧、有方向的假设，因为研究假设假 
定后测试成绩高于前测试成绩。 
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前测试 


后测试 


差异 


D 1 


零假设是 




好0 * 一 ^preltat 

(10.2) 

研究假设是 




^ ^ prrt^tsi 

(10-3) 


2. 设置零假设的风险水平（或显著性水平，或第一类错误）。风险水 
平或第一类错误或显著水平是. 05 ,这完全由研究#决定。 

3 -选择合适的检验统计使用图10, I 所示的流程表，我们确定合 
适的检验方法是非独立均值的 f 检验。因为这两个群体相互不独立，所以 
不是独立均值的《检验。实际上，这两个群体不是参与者群体而是相同参 
与者的两组成绩。两组之间相互依赖。非独立均值 f 检验的另一个名称 
是配对样本的《检验，或相关样本的 i 检验。你会在第13章看到两组成绩 

( 前测和后测）之间相关关系的显著性检验和我们这里计算的^值之间有 
很大关系。 

4. 计算检验统计值（也叫做实际值)。现在我们代人观察值并进行计 
算。上面已经给出《值计算公式。代人具体的值之后，我们就得到等式 
10 ■ 4 ( 我们已经计算了前测和后测成绩的均值和标准差） 
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(10. 4) 


代人具体的数值之后，我彳『]得到下面的等式和最终的实际 f 值 2. 45 。 项目 
前测试成绩的均值是 6. 32 ,项目后测试成绩的均值是 7. 52。 

t = - 3 — = 2. 45 (10. 5) 

/Iso 

5. 使用特定统计量的临界值分布表确定拒绝零假设需要的值。现在 
我们需要査阅附录 B 的表 B 2, 表 B 2 列出了《检验的临界值。我们又一次 
进行了 f 检验，而且应用第9章中用到的相同的临界值表来确定拒绝零假 
设的临界值。 

我们的第一个仟务是确定自由度 （ df ) ,自由度近似于样本规模。对现 
在选定的检验统计 M 来说，自由度是〃 - 1，其中/ I 等于成对观察的参与者 
数 M ， 也就是 25 -H =24 0 这项统计检验的自由度是独特的，对其他统计 
检验来说并不需要。 

使用这个数字 （ 24 ) 、你愿意承担的风险水平 （ 之前定义的 . 05 ) 以及单 
侧检验（因为研究假设有方向——后测成绩大 P 前测成绩 .） ，拒绝零假设 
需要的值是1.711。 

6. 比较实际值和临界值。实际值是 2. 45,大于拒绝零假设值需要的 
临界值。 

7. 和8.做出决定。现在我们孩做出决定了。如果实际值大于临界值 
就不能接受零假设。如果实际值没有超过临界值，零假设就是最有力的解 
释。在这个案例中，实际值超过临界值这个值足够大，我们可以说前 
测成绩和后测成绩的差异的确是由于随机因素之外的因素引起的。如果 
我们的实验安排正确，那么是什么因素影响结果？很简单——是日常阅读 
项目的 引人。 我们知道差异的产生是由于特定的因素。前测群体和后测 
群体之间的差异不可能是由随初 L 因素引起的，而是由于特定的处理因素。 

砰么如何噼释 =2.45， p <.05 

• t 表示我们所用的检验统计量。 

•24 是自由度数值。 

•2.45 是实际值，是使用本章之前给出的公式计算所得的值。 

• p <. 05( 实际上是这个简短表达式中最重要的部分）表示对零假设 
的任何检验来说，后测成绩的均值大于前测成绩的均值是由于随机因素的 
可能性小于5%，也就是说有其他因素在发挥作用。因为我们以 .05 作为 
研究假设比零假设更有解释力的标准,我们的结论就是两组成绩之间具有 
显著性差异。也就是其他因素在发挥作用。 





万卷方 :去 


应用 SPSS 可以随时帮助你进行推论检验3现在就运行我们已 
经完成的检验并对结果进行解释。我们使用的数据集名称是第10 
章数据集1 ( chapterio data set 1 )，这个数据集也用在之前的案例中。 

1- 在数据编辑栏录人数据。要确保前测成绩和后测成绩在不 
同的列。与独立均值 t 检验不同，这里不需要定义组。在图 10.2 
中你可以看到每 一 ■列的开头分别被贴上标签 pretest 与 posttest „ 


图 10.2 第10章数据集丨的数据 

2. 点击 Analyze —► Com pare Means — ► Pared-Samples T test, 你就会 
看到如图 10,3 所示的对话框。 


Pa^edViiablesf 


-Cufrent Selections 


图 10. 3 配对样本 t 检验对话框 
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3. 按住 Shift 键，然后点山变置 pretest 与 posttesl 。 

4. 点由►将选中的变量移到 Pared Variables 框中。 

5. 点击 OK 。 

6. 接着 SPSS 执行分析过程然后得出图 iO .4 所示的结果。 
SPSS 输出结果的含义 

SPSS 的输出结果很明确。先是对不同构成的描述，接着关注在 
本书范围之内而且对理解我们 正在讨 论的检验非常重要的内容。 

首先，对于前测和后测成绩来说，都给出了均值、样本规模、标 
准差和均值的标准误差（对抽样误差的测 量）。 就这个结果来说， 
你可以直接知道后测成绩 (7.52) 大于前测成绩 （6. 32)。进- ■•步 分 
析可以知道这个结果支持研究假设，也就是学生的后测成绩高于 
前测成绩。 

现在来看令人感兴趣的 结果" ~~■与 f 检验相关的实际值。前 
测和后测群体之间的均值之差是 -1. 2,因为是前测成绩均值减去 
后测成绩均值所以是负值。由于随机因素影响使 f 值等于 -2.449 
的可能性是 . 022——所以 jL 不可能的。但是我们还不能得出支 
持研究假设的结论。继续往下看。 

是沔注意到我们这里的结果和应用公式 10.5 手动计算并进 
行分析结果之间的任何差异？ SPSS 输出结果中差异是负值（图 
10.4) o 但 A 我们在手动计算时这个值是正值。你知道为仆么吗? 
因为 SPSS ( 不论是否相信）进行均值之间的单侧检验不是很容易， 
而且总是用第一个变爐 :（ 在这个案例中是前测成绩）减去第二个变 
M ( 在这个案例中是后测成绩）。而我们手动计算时，我们以相反 
的方式进行，与研究假设一致 （ 见公式 10. 3) 。 SPSS 只是不支持这 
种类型的分析。那么我们该怎么做？ 

现在我们回到第9章用到的临界值表，并且如果结果是显著 
的我们就进行分析。使用附录 B 表 B 2, 我们发现对自由度24、显 
著水平 .05 的单侧检验来说，拒绝零假设的临界值是1.711。因 
此，虽然 SPSS 给出特定的£值，但是没有给出单侧检验值的概率水 
平。 SPSS 在双侧检验中给出这种可能性，而在单侧检验中没有给 
出。因此，我们必须依赖自己的技能来近似地获得这个值，就如我 
们在这里所做的，或者使用他可以进行单侧检验的软件（在18 
章可以了解更多相关的内容）。 
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小结 


这是对均值的检验。你已经知道如何比较来自独立群体（第 9 章）和非独立 
群体（第10章）的数据，而且现在是时候更进一步学习处理两个以上群体（可能 
是独立的也可能是非独立的）的显著性检验。这项统计技木就是方差分析，这项 
统计分析工具非常重要、应用广泛，也很有价值。 

练习时间 

1. 独立均值检验和非独立均值检验有何不同？何时使用哪一个？ 

2. 使用第10章数据集 2( cha P ler 10 data 2) 手动计算 t 值，然后将结论写下 

来，也就是25个街区的回收项目是否影响纸的使用量。（提示：项目前和项目后 

是两个不同的测试水平。）在 .01 显著水平下检验零假设。 

3. 使用第10章数据集 3( chapter 10 rlata 3) 计算^值，然后将结论写下来，也 

就是引入服务项目之后使用服务中心的家庭的满意水平是否有差异。使用 SPSS 
完成这个练习，并且给出结果的准确的可能性。 

练习参考答案 

1. 独立均值 f 检验用于检验两个不同的参与者群体，每个群体接受一次测 
试 。 非独立均值 t 检验用于一个参与者群体，其中每一个参与者接受两次测试。 

2. 在回收项目执行之前的均值是 34. 44,项目执行之后的均值是 34. 84。回 
收有所增长。这25个街区的差异是否是显著的？实际^值是.262,自由度是24, 
在 .01 的显著水平下 我们假设在这个显著水平研究假设接受检验，是不显著 

的。结论 是：回 收项目没有影响纸的循环使用量的增长。 

3. 满意水平有所增长，从 5.48 增长到 7 .60,相应的 i 值是-3.893。相应的 

差异的概率水平是 .001 。也就是社会服务项目在发挥作用。 



























两个群体是否太多? 
-尝试进行方差分析 


: 

_ f 






方差分析是什么， f 可时使用 


• 如何计算和解释 F 统计量 
• 如何使用 SPSS 完成方差分析 


方差分析介绍 

心理学的一个新兴领域是体育心理学。虽然这个领域主要关注提高运 
动成绩，但也关注运动的许多其他方面。其中之一是什么心理技能对于成 
为一个成功的运动员是必需的。带着这个问题，马里斯.古塔、杨尼斯•塞 
奥佐拉基斯和乔治斯 * 卡拉莫萨利蒂斯 （Marious Goudas , Yiannis Theodorakis , 
5 r Georgios Karamousalidis ) 对运动员应对技能虽表的有效性进行了检验 c 

作为研究的一部分，他们使用简单的方差分析（或 ANOVA ) 检验假 
设，也就是某项运动的训练年数与应对技能（或者运动员应对技能量表的 
得分）的关系。因为需要检验两个以 h 的群体，并比较这些群体的平均成 
绩，所以使用 7/ 差分析。具体地说，群体 1 是训练年数在 6 年之内的运动 

员，群体2是训练了 7 〜10年的运动员，群体3是训练年数在10年以上的 
运动员。 _ 

方差分析的检验统计 M 是厂值（以这个统计鼠的建立者 R . A . Fisher 
命名），结果是 ^(2.110) =13. 08 , p <• 01。二个群体的压力下廟峰表现子量 
表测试成绩的均值两 两不同 。换句话说测试成绩的任何不同是由于在运 
动方面的训练年数的不间 t 而不是 pf 能影响成绩的随机因素。 

是否想 r 解更多？查阅原始文献：古塔、塞奧佐拉基斯和卡拉奠萨利 
蒂斯 （ Goudas ， M• ， Theodorakis , , & Karamousalidis , K . ) 1998 年发表在 

《感知和运动技能》 （ Percepiuct / and Motor Skills ) 86 期 59 - 65 页的文 章“篮 
球运动中的心理 技能： 发展运动员应对技能童表的希腊形式的初步研究 

(Psychological skills in baskel hall : Preliminary study for development of a 
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二 reek form of the Athletic Coping Skills Inventory) 0 f * 

知识和智诂路往 

下面介绍如何使用图 H . 1所示流程表选择方差分析作为合适的统计 
检验方法。沿着图中加黑的步骤就可以。 



1 一我们检验不同群休之间的差异，在这个案例中是检验运动员巅 
峰成绩的差异。 

2— 每一个运动员只接受一次测试。 

3 — 有三 个群体（按训练年数分为6年以下、7 ~ 10年和10年以 
上）。 

4 一 合适的检验统计是简单方差分析。 

方差分祈的不同真型 

方差分析有许多不同的形式 o 最简单的形式是简单方差分析 （simple 
analysis of variance ), 也是本章的重点，只分析一个因素或者一个处理变 M 

(如群体身份），而有两个以上的群体受到这个因素的影响。简单方差分 

析也叫遞一元方差分行 （ one-way analysis of variance ) ，因为只有 一 个分组 

维度。这项技术叫做方差分析，这是由于运动成绩差异产生的方差可以分 
解为群体内个体差异产生的方差和群体之间差异产生的方差。接着对两 
类方差进行相互比较。 

实际上，方差分析在许多情况下类 似于/ 检验。在这两项检验中都需 
要计算均值之间的 差异。 但方差分析要处理两个以上的均值。 

例如；我们调査每个星期呆在预备学校5,10和20个小时对语言发展 
的影响。每个孩子所厲的组别就是处理变量，或者就是分组因素。语言发 
展是被解 释变虽 或者是结果。实验设计类似如下所示。 

组】（每星期 5 小时） 组 2 (每星期 10 小时） 组 3( 每星期 20 小时） 

语言发展测试成绩 语言发展测试成绩 语言发展测试成绩 


更复杂的方差分析类型是析因设计 （factorial design ) ，是分析一个以 
上的处理变量。下面的案例是研究参加预备学校的时间所产生的效应，但 
是性别差异产生的效应也是研究的内容。实验设计类 似如下所示： 


参加预备学校的时间 

性別 

组 1( 每星期 5 小时） 

组 2( 每星期10小时) 

组 3 (每星期20小时) 

男 

语言发展测试成绩 

语言发展测试成绩 

语言发展测试成绩 

女 

语言发展测试成绩 

语言发展测试成绩 

语言发展测试成绩 
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这是3 x 2 的析因设计。3表示分组因素有三个层级（组1，组2和组 
3)。 2 表示其他分组因素有两个层级（男和女〉。综合起来就有6种不同 
的可能性（每个星期呆在预备学校5小时的男生，每个星期呆在预备学校 
5小时的 女生； 每个星期呆在预备学校10小时的男生，等等）。 

析因设计遵循和简单方差分析一样的基本逻辑和原则，但是析因设计 
更为复杂，需要同时检验一个以上的因素的影响以及因素综合的影响。不 
用担心一一接下来的一章会全面学习析因设计。 ^ 


计算检验统计量 


简单方差分析检验两个以上的群体在一个因素或一个维度上的均值 
差异。例如，你可能想知道四个群体（20,25,30和3 5 岁的年龄群体）对私 
人学校的公共财政支持的态度。或者你想知道5个不同年级（2,4,6,8和 
10年级）的学生群体的父母参与学校活动的水平是否有差异。 

任何分析如果 

• 只有一个维度或者一个处理变量， 

• 分组因素有两个以上的层级，而且 

• 关注不同群体在平均成绩上的差异 
就需要使用简单方差分析。 

F 值是检验假设也就是群体之间 （「差 异的检验统计量，计算公式如公 
八 111 所示。就方差分析而言这是简单的公式，但是相对于前几章学习 
的其他检验统计量来说需要花费更多精力来计算。 


F = 






这个比率背后的逻辑就是这样。 


如果组内完全没有变化（所 


有的成绩都相同），那么组之间的任何差异都有意义，对吧？可能 
如此。方差分析公式（是一个比率）比较组间的变化量（由于分组 
因素产生）与组内的变化量（由于随机因素产 生〉。 如果比值为1， 
那么组内差异产生的变化 M 等于组间差异产生的变化量，而且组 


间的任何差异都不显著。如果组间差异的平均值变大（也就是比 


率的分子变大） ， F 值也变大。如果 F 值变大，在所有的 F 值分布 
中就会更趋向于极值，也就是更可能由于随机因素之外的因素 


影响 


下面给出一些数据并初步的计算来说明 F 值如何计算。就我们的例 
子来说，我们假定这是三个预备学校参与者群体和他们的语言测试成绩。 
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群体1的成绩 

群体2的成绩 

群体3的成绩 

87 

87 

89 

86 

85 

91 

76 

99 

96 

56 

85 

87 

78 

79 

89 - 

98 

81 

90 

77 

82 

89 

66 

78 

96 

75 

85 

96 

67 

91 

93 


下面是著名的八个步骤和 F 检验统计量的计算。 

1. 零假设和研究假设的表述。公式 II . 2 所示的零假设表示三个不同 
群体的均值之间没有差异。方差分析，也叫做 f 1 检验（因为计算得出的是 
F 统计量或 F 比值），寻求不同群体之间所有的差异。 

F 检验不是分析配对差异，如群体1和群体2之间的差异。我们需要 
使用另一项统计技术进行配对差异分析，本章后面部分会讨论 

% : Mi =内=叫 (11.2) 

公式 11.3 所示的研究假设表示三个群体的均值之间相互有差异。要注意 
的是所有的差异之间没有方向，这是因为所有的 F 值都是无方向的。 

ffi * Xi 7^ Kj ^ (11* 3 ) 



2. 设置零假设的风险水 f ， （或显著性水平，或第一类错误）。风险水 
平或第一类错误或显著水平（或者其他名 称？〉 是 . 05。再一次申明，风险 
水平完全由研究者决定。 


3.选择合适的检验统计量。使用图 11.1 所示的流程表 t 我们确定合 
适的检验方法是简单方差分析。 
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万卷方法 
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4. 计算检验统计值（也叫做实际值）。 

现在我们代人具体的值并进行计算。需要进行很多计算。 

^值是组间差异和组内差异的比值。要计算这些值，首先我们要计 

算每一种差异-组间、组内和总的差异的平方和。 

•组间差异平方和等于对所有值的均值和每一个群体的均值之差平 
方然后求和。这意味着每一群体的均值和总的均值的差异的大小^ 
•组内差异平方和等于对群体内每一个具体的值和这个群体的均值 
之间的差异平方然后求和。这意味着群体内每一个值和这个群体 
的均值的差异的大小。 

•总的差异平方和等于组间差异平方和与组内差异平方和的总和。 
现在我们计算这些值。 

依据上面给出的实际数值计算所有需要计算的组间、组内和总的 T : 方和。 
首先，我们看看这个扩展的表中所有的项目，先从这个表的左下角 开始： 
n 表示每个群体的参与者数量（如 K )) 

2^表示每个群体的具体数值的总和（如 766) 

文表示每个群体的均值（如 76 . 6 0) ^ 

Z ( X 1 ) 表示每个数值的平方和（如59 964) 

! S ^ ) /«表承每个群体的所有数值的和的平方除以群体的规模 
( 如58 675 . 60 ) 

其次，我们看看表的右下角的项目 
N 表示参与者的总体数量（如 30) 

S 乙尤表示所有群体的数值的总和 
| 1工尤) 2 /#表示所有数值的总和的平方除以 7 V 

S Z (^ 2 )表示所有数值的平方的总和 

£ ( X ^ i 表示每个群体和的平方的总和除以 n 

以上是所有需要进行的计算，我们也几乎完成了计算。 

首先我们计算所有不同来源的差异的平方和，也就是进行这样的 
计算： 

组间平方和 

2 2 

X [ T X ) /n ^ (x X x ) /AT 或者 215 171.60 -214038,53 = l 133.07 
组内平方和 


X Z (^ 2 ) - E ( X X I △， 或者 216 910 -215 171.6 = i 738.40 
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总平方和 

i ^ 2 1 - (x z 尤 ) 2// v 或者 216910 - 214038 - 53 


= 2 871.47 


其次，我们需要计算平方和的均值，也就是简单的平方和的平均值。 

这些都是最终计算^比率需要的方差估计。 

我们是以近似的自由度 （#) 去除每一个平方和。还记得吗？自由度 
是样本规模或者群体规模的近似值 C3 对方差分析来说我们需要两类自由 
度。对组间估计来说，自由度是 A _ 1，其中 A 等于群体的数在这个案例 
中，有3个群体，自由度是 2) ，对组内估计来说，我们需要的自由度是~ - 
A ，其中 W 是总的样本规模（也就是说自由度是30 - 3 ,或27 ) 。而且 F 比 
率是组间差异平方和均值与组内差异平方和均值的简单比值，或 566 . 54/ 
64.39 =8.799。这就是实际的 F 值。 

下面的表格总结了用于计算^比率的方差估计，也是专业期刊和手 
稿中大多数 F 表出现的形式。 


来源 

平方和 

df 

平方和的均值(均 方） 

F 

组间 

1 133.07 

2 

566-54 

8,799 

组内 

1 738,40 

27 

64.39 


总和 

2 871-47 

29 




要计算一个小小的 F 值确实挺麻烦啊！但是我们之前已经说过，至 
少手动计算一次对了解计算过程很重要。计算过程会告诉你这些数字的 
来源，而且一定程度上可以更好地了解这些数字的含义。 



5,使用特定统计童的临界值分布表确定拒绝零假设需要的值。就如 
之前所进行的，我们需要比较实际值和临界值。我们现在需要査阅附录 B 
表 B 3, 也就是 F 检验的临界值分布表。我们的第一个任务是确定分子的 
自由度，也就是 A : - 1，或3 =2。接着确定分母的自由度，也就是 / V -&, 

或30 -3 =27。结合在一起可以表示为心 2 .27)。 

实际值是 8. 80,或 Fu .27 :i =8 .80。在显著水平为 . 05、分子自由度力2 
(由表 B 3 中的纵行表示）、分母自由度为27 ( 由表 B 3 中的横行表示）情况 
下临界值是 3. 36。也就是在显著水平为.05、自由度是2和27的三个群体 

的均值的综合检验来说，拒绝零假设所需要的值是3.36。 

6* 比较实际值和临界值。实际值是 8. 80，在 ■ 05显著水平下拒绝零假设也 
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爱上统计学 


就是说三个群体相互有差异 （ 没有关注差异在什么地方）的临界值是 3. 36。 

7.和8 ■做岀 决定。现在我们该做出决定了。如果实际值大于临界值 
就不能接受零假设。如果实际值没有超过临界值，零假设就是最有力的解 

释。在这个案例中，实际值超过临界值-这个值足够大,我们可以说三 

个群体之间的两两差异不是由于随机因素引起的。如果我们的实验过程 

正确，那么是什么因素影响结果？很简单-是在预备学校的时间。我们 

知道差异的产生是由于特定的因素，因为群体之间的差异不可能是由随机 
因素引起的，而是由于特定的处理变量。 

舞 P 么如何鮮释 27> = 8. 80,/? <.05 

■ F 表示我们使用的检验统计量。 

• 2 , 27 是组间估计和组内估计的自由度数值。 

•8.80 是实际值，是使用本章之前给出的公式计算所得的值。 

• /> < . OS ( 实际上是这个简短表达式中最重要的部分）表示对零假设 

的任何检验来说,每个群体语言技能的平均成绩相互不同的原因是由于随 

机因素而不是实验变量的影响造成的可能性小于 5 % 3 因为我们以 .05 作 

为研究假设比零假设更有解释力的标准，我们的结论就是三个群体之间存 
在显著差异。 



想象这样的事件。你是广告公司的有高级授权的研究者，想 
知道颜色是否影响销售。.而且你在 .05 的显著水平下进行检验。 
你将全黑、全白、 25% 带彩色、 50% 带彩色和 〗 00% 是彩色的产品集 
合在一起构成 5 个不同的层级。然后进行方差分析并发现有差异 
存在。但是方差分析是综合的检验，你不知道显著差异的来源。 
因此你一次只能选择两个群体（如 25% 带彩色和 75% 带彩色）然 
进彳 了相互检验。实际上你要检验每—个两两群体组合的差异。 
这样做对吗？不对。这被称为多元 t 检验，而多元 J ! 检验实际上违 
反一些原则。当进行 多元/ 检验时，由于要执行的检验的数量增 
加，第一类错误（你设定为 ,05) 发生的可能性提高。这项检验中有 
10 对可能的群体差异比较（如没带彩色与 25% 带彩色，没带彩色 

与 50% 带彩色，没带彩色与 75 %带彩色等），第一类错误真 i I :发生 
的可能性是 1 - (1 — Of ) ^，其中 

«表示第一类错误发生的水平，在这个案例中是 . 05 
A 表示比较的数量 

因此每一对比较群体被检验时实际的第一类错误不是 ,05, 而 
是. 4 0(原书为 .22), 或者 


- (1 05) 


40 ( !!!!!) 


肯定不是 .05 Q 差异很大，不是吗？ 
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使用计算机计算 F 比率 



F 比率不容易手动计算。需要太多的计算才能得出 F 比率。 
使用计算机会更容易、更准确，因为计算机可以消除计算上的误 
差。也就是说你会为手动计算了这个值而感到髙兴，因为这是一 
项你应该掌握的技能。可也会同样高兴可以使用类似 SPSS 的工 

具来计算。 

我们使用第 n 茕数据集1 (chapter 1 1 data sbt 1 ) 中的数据，也 

就是之前预备学校案例中使用的数据。 

1.在数据编辑栏录入数据。要确保群体在同一列，这一列中 
有三个不同的群体。在图 11. 3你可以看到每一列开始的标签分 

别为 group 与 lang _ sc 。 



图 U .3 第11章数据集1数据 ‘ 

2. 点击 Analyze ― ►Compare Means — ► One-Way 方盖分析，你就会 

看如图 11.4 所示的一元方差分析对话框。 

3. 点击变量 group , 然后点击►将选中的变量移到 Factoi ■框中 0 

4. 点击变量 lang _ sc f 然后点击►将选中的变置移到 Depend 

List 框中。 . / 

5. 点出 Opertions ， 接着点击 Descriptives ,然后点山 Continue 。 

6. 点击 OK。SPSS 执行分析过程然后得出图 11.5 所示的结果。 
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图 1 L 4 —元方 差分析对话框 


SPSS 猞出结果的含义 

SPSS 的输出结果很明确，而胜和之前我们展示如何计算 F 比率而 
建立的表类似，同时给出 r 描 述统到 iiL 下面就是我们得到的内容。 

1 - 我们确定的方差来源——组间、组内和总的方差 c 

2- 接着是我们需要的不同来源的差异平方和。 

3•然后是自由度，以及平方和均值（或均方），也就是平方和除 
以自由度。 

最后，就是实际值和相应的显著 水平。 

要记住的一点是假设是在 . 05 的显著水平检验。 SPSS 的输出 
结果给岀了结果的准确的概率水平，. 001* ——比. 05 更为准确，而 
且更不可 能。； 



现在你已经运行了方差分析分析，也知道三个 、四 个或者更多 
群体之间有差异。但是差异处在什么位置？你已经知道不能进行 
多元2检验，就需要进行事后 （post hoc ) 比较检验或既成事实 （ af ¬ 
ter - the - fact ) 分析。 也就是每一个群体的均值和另一个群体的均值 
比较，然后来看差异处在什么位置，但是最重要的是每一次比较的 
第一类错误都控制在你设定的相同的水平。其中要进行许多不同 
的比较，也就是 Bonfemmi (作者偏好使用的统计学 词汇） 分析。使 
用 SPSS 完成特定的分析之后，在方差分析对话框（图 11.4) 你可以 
看到 Post Hoc 选项，选中这个选项之后点击 Honferroni ,接着点击 
Continue , 然后你就看到如图 11.6 所示的 SPSS 输出结果。你可以 

很容易就看到这些分析告诉你引起三个群体之间整体的显著性差 
异的群体配对显著性差异处在群体1和群体3之间，而且群体1和 
群体2或群体2和群体3之间没有配对差异。配对分析非常重要， 
可以让你知道两个以上群体差异的来源。 
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小结 


方差分析（方差分析）是《爱上统计学》这本书中你能学到的最复杂的推论 
检验。你需要付出更多的精力来进行手动计算，即使可以使用 SPSS ， 你也必须真 
的了解这是综合的检验，而且只做部分的话不能给出配对群体差异的信息。只 
有紧接着进行事后分析，你才真正完成与这项有力的工具相关的所有的工作。 
如果是均值之间不止一次的检验，那么就是析因方差分析。还有 Holy Grail 方差 

分析，可以分析两个或更多因素，但是我们主要讨论两个因素的方差分析，而且 
SPSS 会展示出具体的方式 D 


练习时间 


例和 




1. 使用下面的表给出三个简单一元方差分析案例、两个两因素方差分析案 

一 个三因素方差分析案例。我们给出一些案例，比照我们所做的确定分组 
和检验变量。 


设计 

分组变量 

检验变量 

简单方差分析 

培训时间分为四个层 
级——2、4、6和8个小时 

j 打字的准确程度 


填人你的案例 

填人你的案例 

填人你的案例 

填人你的案例 

填人你的案例 

填人你的案例 

两因素方差分析 

培训的两个层级和性别 
(2 x 2 设计） 



填人你的案例 

填人你的案例 

填人你的案例 

填入你的案例 

三因素方差分析 

培训的三个层级、性别和 
收人的三个层级 i 

选举态度 


填人你的案例 

填人你的案例 


2* 使用第 11 章数据集 2 ( chapter 11 data 2 ) 和 SPSS ，计算游泳者每周训练的 
平均时间（ <15,15-25 以及 >25小时）的三个层级比较的 尸比率 ，被解释变量 

或结果变量是100码自由泳时间。回答这个问题，也就是训练时间是否产生差 
异。不要忘记使用 Options 选项得到群体的均值。 
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练习参考答案 


设计 

分组变量 

检验变量 

简单方差分析 

培训时间分为四个层级—— 
2、4、6和8个小时 

n 字的准确程度 


三个年龄群体——20岁、25 
岁和30岁 

力量 

六种工作类型 

工作绩效 

两因素方差分析 

培训的两个层级和性别 （2 x 2 
设计） , 



三个年龄 群体一 一3、10、15 

岁，兄弟的数量 

社交技能 

三因素方差分析 

培训的三个层级、性別和收人 
的三个层级 

选举态度 


课程类型（类型1和类型 2), 
GPA (3.0 以上和以下），以及 

活动参与度 （ 参与和不参与） 

ACT 成绩 


2 . 三个群体的均值分别是 58. 05秒、 57. 96秒和 59. 03秒， F 值 （ F 2 B = 

.160) ，差异来自于随机因素的可能性是 .853, 远远大于我们预期的由于处理变 
量引起的可能性。我们的结论是什么？训练时间并不对游泳速度产生影响。 




• 何时使用一个以上因素的方差分析 
• 什么是主效应和交互效应 
• 如何使用 SPSS 完成析因方差分析 


析因方差分析介绍 

人们如何做岀决策已经成为迷惑心理学者几十年的问题。这些研究 
形成的数据广泛地应用在广告学、商业、规划和宗教领域。米尔蒂 亚德. 
普罗阿斯与乔治_多加尼斯 （Mihiadis Proios & George Doganis ) 研究积极 

参与决策过程（在一系列的条件下）的经验和年龄如何对道德归因产生影 
响。研究样本由148个裁判构成一一56个足球裁判、55个篮球裁判以及 
37个手球裁判。他们的年龄范围是〗7 〜 50岁，性别不是考虑的重要变 
M 。 在整个样本中，大约8%没有社会、政治或运动领域全面参与决策制 
定过程的任何经验，大约53 %表现积极但是没有全面参与，大约39%既表 
现积极，又全面参与一些组织中的决策制定。二元方差分析（在第17章可 
以更多了解多元方差分析）可以展现经验和年龄对道德归因和裁判的目 
标定位的交互影响。 • 

什么是二元方差分析？很容易——有两个独立因素，第一个是经验水 
平，第二个是年龄。与每一个方差分析程序相类似，包括 

1. 对年龄的主效应的检验。 

2. 对经验的主效应的检验。 

3. 对经验和年龄的交互效应的检验(结果可能是显著的）。 

在检验一个以上因素或者独立变量时就体现出方差分析的一个重要 
特点，也就是研究者可以分析每一个因素的效应，同时可以通过交互效应 
分析两者共同的效应，在本章后面的部分会进行更多的讨论。 

是否想了解更多？查阅原始 文献: 普罗阿斯与多加尼斯 （ Proios ， M . & 








下面介绍如何使用图 12. 1 所示流程表选择方差分析（现在处理一个 
以上的因素）作为合适的检验统计 a 沿着图中加黑的步骤就可以。 

就如在第11章一样，我们已经确定方差分析是正确的选择（检验多个 
群体之间差异或者独立变量的多个层级之间的差异），但是我们要处理不 
止一个因素，析因方差分析是正确的选择。 


1一 我们检验不同群体的数值之间的差异，在这个案例中是检验经 
验水平和年龄之间的差异^ 

2— 参与者接受一次测试。 

3 — 我们检验两个或多个群体。 

4 一 我们处理不止一个因素或独立变量。 

5 —合适的检验统计是析因方差分析。 


方差分析的軒类型 

你已经了解方差分析的一种形式，也就是第 U 章讨论的简单方差分 
析。简单方差分析只分析一个因素或者处理变最 （ 如群体身份），而且这 
个因素或者处理变量可分为两个以上的层级或群体。 

现在，我们对整个技术进行发展，进而可以同时分析不止一个因素，也 
就是仏•因方差分析 （factorial analysis of variance ) 0 

现在我们来看一个简单的包含两个因素的案例 ：性别 （男和女）和处 
理变量_—处理变童是不同类型的训练项目 （ 髙强度和低强度），以及结 
果—#:重减少的数量。这个案例的实验设计类 似于： 

_ 训练项目 

高强度 


低强度 


女性 


接着我们来看什么是主效应和交互效应。现在不进行更多的数据分 
析，在本章的最后才会相应的增加数据分析，现在只是看和了解。 
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就析因分析来说你可以提出并回答三个问题。 

1 • 不同的训练项目层级也就是高强度和低强度之间是否有差异？ 

2. 不同性别——男性和女性之间是否有差异？ 

3. 髙强度或低强度项目是否对男性或女性有不同的效应？ 

问题1和问题2确定主效应是否存在，问题3确定两个因素之间是否 
有交互效应。 


主要方 面:析 因方差分析的主效应 


你应该记得方差分析的最初 S 标是检验两个或两个以上群体之间的差 
异。如果数据分析表明某个因素的不同层级之间存在差异，我们就会说存 
在主效应 （main effect ) 0 现在来看一个例子，上面给出的案例中共有四个群 
体，每个群体10个参与者，总共是40。下面给出可能的分析结果（我们使用 
SPSS 计算得出这个紧凑的表格）。这个表也叫做源表 （source table ) 。 


主效应与交互效应检验 
被解释变 tt : LOSS 


来源 



现在只关注来源列和列（已经用阴影显示）。我们可以得出的结 
论是性别有主效应 （P = . 000) ，而处理变量没有主效应 （p 7.091 ) ，而且这 
两个主要因素之间没有交互效应 （ P =. 665)。因此在高强度组或低强度 
组对减少体重来说并不重要，但是性别是重要的影响因素。而且处理因素 
和性别之间没有交互效应，所以不同的强度对性别没有差异性影响。 

如果将对应的均值绘图，就会得到图 12.2 的形象展示。 

在图 12.2 中你可以看到男性和女性在“减重 （ Loss ) ’’轴相差的距离很 
大（男性的均值是 85. 25,女性的均值是 67. 30)。但是对处理变量来说 
(如果你计算了平均值），你会发现差异很小 （ 髙强度项目的均值是 73.00, 
低强度的均值是 79. 55 ) 。当然现在是进行方差分析，群体内的变化很重 
要，但是在这个案例中，你可以看到每一个因素（如性别）的群体间的差异 
( 如男性和女性）以及他们如何在分析结果中反映。 










/2 两个因素——祈因方差分析 
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—男性 
— »—女性 



图12, 2处理 变射对 应男性和女性的均值 

更有趣的方 面：交 互效应 


现在开始讨 论交江 效应。先看一组新数据的源表，这些数据表明男性 
和女性受到处理变量的影响，也就是存在交互效应 （interaction effect ) 0 而 
且你还可以看到一些非常有趣的分析结果。 


主效应与交互效应检验 
被解释变 tt : LOSS 


Total 

Corrected Total 


来源 

第三类平方和 

df 

均方 

F 

Sig, 

Corrected Model 

1 522.875 1 

3 

507.625 

4.678 

,007 

Intercept 

218 892,025 

I 

218 892.025 

2 017.386 

.000 

TREATMEN 

265 ■ 225 

1 

265,225 

2,444 

• m 

GENDER 

TREATMEN * 

207,025 

* I 

207.025 

1,908 

* 176 

GENDER 

Error 

I 050* 625 

3 096*100 

1 

36 

I 050,625 

108.503 

9 * 683 

.004 


224 321. 

5 428.975 


40 

39 


处理变量和性别没有主效应（分别为 /> =. 127,/) = . 176) ，但是存在交 
互效应 （P = . 004 ) ，这是一个非常有意思的结果。实际上，你是在高强度 
项目或者低强度项目或者你是男性或者女性都不重要， fj 〖是处理变 量对丁 
男性和女性的体重减少有不同的影响。 

现在给出四个群体的均值的图形展示（图 12.3 所示）。 
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男性 
—■ 女性 



12.3 处理变置对男性和女性的均值 


下面列出实际的均值大小（应用 SPSS 计算）: 



男性均值 

女性均值 

高强度 

73.70 

78.80 

低强度 

79.40 

64.00 


如何理解这个结果？解释非常简洁。下面是我们可以做出的解释，就 
如你可以认识到的，这是之前列出的三个问题的答案。 

训练类型没有主效应。 

性別没有主效应。 

处理变量和性别之间有明显的交互效应，也就是说在髙强度项目中女 
性减少的体重比男性减少的体重多，而在低强度项目中男性减少的体重比 
女性减少的体重多。 

需要记忆的内容 

这是特别需要记忆的内容。如果没有掌握更多的知识（也没 
有持续学习到本章），你可能会认为你必须做的所有分析都是男性 
和女性均值之间的 t 检验，或者参与髙强度训练项目的群体和参与 
低强度项目的群体的均值之间的另一种简单的 t 检验——不过你 
不会有所发现。但是如果考虑到主要因素之间的交互效应，就会 
发现不同的效应的存在——这是其他的分听没有注意到的结果。 
实际 ±1 你不但可以接受这项结果，而且交互效应是任何析因方差 
分析中最有趣的结果。 

计算检验统计量 



现在要面对一种改变。在《爱上统计学》整小卜;中，我们提供 





-定的案例展示如何使用老的方式 （ 使用计算器手动计算）或者应 
用类似 SPSS 的统计分析软件包进行特定的统计分析。对于析因 
方差分析的介绍，我们只使用 SPSS 来说明一这不是由于应用计 
算器完成析因 ANOVA 更具知识上的挑战性，而是由于计算工作童 
太大。正是由于这个原因我们不准备 T 动进行所有的计算，而是 
直接对重要的值进行计算，并且将更多的时间用在解释方面。 
我们使用之前展示的存在显著的交互效应的那组数据。 


下面是著名的八个步骤和 F 检验统计量的计算。 

I . 零假设和研究假设的表述。实际上这里出现的零假设有三个（公 
式] 2. la ,12. lbJ 2.1 c ) ，表明两个因素的均值之间没有差异，没有交互效 
应。现在就具体描述。 

首先，对处理变量来说… 


对性别变 M 来说， 


对处理变驗和性别之间的交互效应来说, 


公式 12.2 a ，12.2 b ，12.2 c K 示为研究假设，表明群体的均值之间有差 
异，而且存在交互效应。具体如下。 

首先，对处理变量来说… 




^ high 




螫 


对性别变 tt 来说 


对处理变量和性别之间的交互效应来说 


处理变量 一 ^ 
性别^ 一~ ^ 

髙强度 

男性 

高强度 

女性 

低强度 

男性 

低强度 

女性 


76 

65 

88 

65 


78 

90 

76 

67 


76 

65 

76 

67 


76 

90 

76 

87 


76 

65 

56 

78 


74 

90 

76 

56 


74 

90 

76 

54 


76 

79 

98 

56 


76 

70 

83 

54 


55 

90 

78 

56 
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^ \ ^ high xittniit , ^ high xfimalf ^ low x male ^law x/emaie 


(12. 2 c ) 


2 .设置零假设的风险水平（或显著性水平，或第一类错误）。风险水 
平或第一类错误或显著水平是.05。再一次强调，风险水平完全由研究者 
决定 D 


3•选择合适的检验统计盪。使用图 12. 1所示的流程表，我们确定合 
适的检验方法是析因方差分析。 



4. 计算检验统计值（也叫做实际值）。我们使用 SPSS 来计算 9 并给出 

具体的运行步骤。我们使用上面给出的数据，这些数据可以从网上下载, 
数据集名称是第 12 章数据集 1 ( chapter 12 data 1 )( 也在附录 C 中列出）。 

在数据编辑栏录人数据，或打！ 「•数 据文件。要确保每一个因 
素也就是处理变 M 和性别在不同的列，如圈12+4所示。 


編 Chapter 12 Data Set 1 * SPSS Data Editor 


芒加_愈咖 


^ y | 

t m dvhii-g mQiri', 

i v. j. - ■: 


1 幽 



treatmen 


loss j 


High Imp3 

Male 

_ ^ 


High Impac 

Male 


781 

fnw. 

High tmpac 

Male 

| 761 

: 4 

High Impac 

Male 

7B 

5 

High Impac 

Male 

76 

6 

High Impac 

Male 

74 

:， 7 

High Impac 

Male 

74 

8 

High Impac 

Male 

76 

9 

High Impac 

Male 

7B 

-i ： 

High Impac 

Male 

55 


图 12.4 第 〖 2 章数据集 1 的数据 

5. 点击 Analyze — ►General Li near Model — ►Univariate, 你会看到如图 12.5 
所示析因方差分析对话框。 

6 . 点击变量 loss ，然后点击►将选中的变鐘移到 Depend Variable 
框中。 

7 ■点击变量 treatment ，然后点山►将选中的变 M 移到 Fixed Factors 
框中。 

8- 点击变屬： gender ,然后点击►将选中的变 M 移到 Fixed Factors 

框中 0 


9-点击 Opertions , 接莽点击 Descriptives »然后点击 Continue 。 
10. 点击 OK。SPSS 执行分析过程,然后得出图 12.6 所示的结果 








_ 




Random h ado! 


v.' =.=• ： -jS 


Fixed Factcn ㈤ 


ependent Vdfiablp; 


析因方差分析的 SPSS 输出结果 


12 . 


a.R Squared", 28 I(Atijunt^d R Squared-.221) 


1 522.875° 
21R 892.025 
207.025 
265.225 
1 050.625 
3 906/100 
224 32 LOGO 
5 428.975 


Oorrecled Model 

Intercept 

GENDER 

TREATMEN 

GENDER，TREATMEN 

]rrof 

Total 

Corrected Tolal 


3 

1 

1 

1 

1 

36 

40 

39 



507-625 
218 892,025 
207.025 
265.225 
i 05(X625 
108+503 


Type IB Sum 
of Squ 


Soisrce 


Sig, 


Mean Square 


Tests of Between-Subjecte Effects 

Dependent Variable:LOSS 


图 115 析因方差分析对话框 

Univariate Analysis of Variance 


Between-Subjects Factors 



WLS Weight 










个因素 —— 析因方 • 


12 


§ 0 6 7 4 
00 r 1712 i 




























































158 


万卷 jr 法 


爱上统计学 



为什么 SPSS 的输出结采的 f 小签为 Univariate Aanalysis of Vari - 
tmcd 单变量方差分析）？也许你想知道。就 SPSS 而言，这项分析 

只处理一个被解释变 M 或者结果变量-我们的这个案例中就 

是体重减少。如果我们的研究问题中不止一个变 M (如对吃的态 
度），那么就是多元方差分析，在检验群体差异的同时要控制独立 
变董之间的关系。第 n 章会讨论更多的内容。 


SPSS 输出结果的含义 

SPSS 的输出结果很明确。下面就是我们得到的内容。 

1* 我们确定的方差来源——组间、组内和总的方差。 

2. 接着我们确定不同来源的平方和。 

3. 紧接着是自由度，以及平方和均值（均 方〉 ，也就是平方和除以自 
由度。 


4. 最后就是实际值和相应的准确的显著水平。 

5. 对性别来说，在期刊或者报告中出现的结果形式类似于 = 
1.908= , 176。 


6. 对处理变量来说，在期刊或者报告中出现的结果形式类似于 
^(1,36) =2.444 ，P = * 127 0 


7 . 对交互效应来说，在期刊或者报告中出现的结果形式类似于 
;9, 683 ，P = ,004。 


现在都已经完成。 



小结 

我们已经完成了群体均值之间差异的检验，接下来要研究相关关系的显著 


I — 


，或者说两个变量之间的关系 



练习时间 

1 . 何时使用析因方差分析 而不是 简单方差分析检验两 个或更多群体 之间差 
异的显著性。 

2. 建立可以进行析因方差分析的 2 x 3 实验设计。 

3. 使用第 12 章数据集 2( chapter 1.2 data 2) , 用 SPSS 完成分析并解释结果。 
这是一个 2 x 3 实验设计，类似于问题2要求的答案。 

练习参考答案 

1. 很容易，析因方差分析只用于不止 一 个因素和独立变量的分析。当你假 
设交互作用的存在时，实际上获得结果不是很容易 （但是 只要你获得结果，你就 



J 2 两个因 素_一 栴因方差分析 
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Corrected Model 

266. 742 

Intercept 

3 070.408 

SEVERITY 

.075 

TREATMEN 

263,517 

SEVERITY * 


TREATMEN 

3.150 

Error 

231-850 

Total 

3 569.000 

Corrected Total 

498.592 


53.348 

26.23! 

3 070-408 

1 509,711 

,075 

• 037 

131.758 

64.785 

1,573 

.774 

2.034 



就我们的解释来说，在这个数据集中，疾病严重性没有主效应，处理变量有 
主效应，两个主要因素之间没有交互效应。 


会真正理解） 


o 


2. 这里可以给出许多不同的可能的案例，下面是其中之 


o 


个处理变量 


(因素）有三个层级，疾病严重性分为两个层级 


疾病严重性 


处理变 M 



药品 1 

药品 2 

药品 3 

严重 




轻微 





3_源表类似如下所示 

主 效应与交互效应检验 
被解释变量 : PAIN_SCO 


来源 


第三类平方和 df 


均方 


F 


%- 



0 0 8 0 3 
olo(4l(M 6 
0<O<8O< 4 

■>»■,P* 




近亲还是好朋友 
使用相关系数检验关系 




• 如何检验相关系数的显著性 
• 相关系数的解释 
• 显著性和有意义的重要区别 

• 如何使用 SPSS 分析有相关关系的数据以及如何理解分析结果 


相关系数检验的介绍 

丹尼尔 • 舍克 （Daniel Shek ) 在他研 究婚姻 质量与父母-子女关 系的文 
章中告诉我们至少存在两种可能性。首先，失败的婚姻可能促进父母-子 
女关系。这是由于父母对婚姻不满意，就可能以与子女的关系替代夫妻关 
系来实现情感的满足。另外，依据进一步的假设，失败的婚姻也可 能破坏 
父母-子女关系。这是由于失败的婚姻可能增加了抚养子女的闲难。 

舍克研究了 378 对中国夫妇 2 年期内的婚姻质量与父母-子女关系之 
间的关系。他发现婚姻质量水平越高，父母-子女关系水平也越高；截面 
(现时）数据和纵向（一定时期）数据都支持这项发现。他也发现父母-子 
女关系的强度对父亲和母亲是一样的。这是一个明显的例证，可以说明如 
何使用相关系数给出我们需要的关于一个变量和另一个变量相关的信息。 
舍克全面计算 r 时期1、时期2与父亲和母亲之间不同的相关关系，所有 
的计算的目的都相 同：确 定变量之间是否显著相关。要记住，这不是说变 
量关系存在任何因果性，只是说一个变量和另一个变量相关。 

如果想了解更多，请査阅舍克 （ Shek, D. T. L. ) 1998 年发表在《家庭问 
题杂志》 （ JoumaZ o/ Family /srnes) 第 19 期 687〜704 页的文章“婚姻质超 

和父母-子女关系之间的关系 （Linkage between marital quality and parent - 
child relationship ) Q if 

知识和智识路往 

下面介绍如何使用流程表选择合适的统计检验来检验相关系数。沿 
着图 13. 1 中加黑的步骤就可以。 . 
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1 一我们检验变量之间的关系而不是群体之间的差异。 
2_只检验两个变量之间的关系。 ， 

3—所要应用的合适的检验统计量是相龙系数的 f 检验。 


计算检验统计量 

你会喜欢看到下面的资 料：相 关系数本身可以作为自己的检验统计 

量。你不需要计算任何检验统计量，而且检验显著性也非常的容易，这使 
事情变得相当简单。 

我们现在利用下面的一组数据举例说明两个变釐——也就是婚姻质 
量和父母-子女关系水平—之间关系的检验， 


婚姻质量 

父母-子女关系水平 

76 

43 — 

81 

33 

78 

23 

76 

34 

76 

31 

78 

51 

76 

56 

78 

43 

98 

44 

88 

45 

76 

32 

66 ， 

33 

44 

28 

67 

39 

65 

31 

59 

38 

87 

21 

77 

27 

79 

43 

85 

46 

68 

41 

76 

41 

77 

48 

98 

56 

99 

55 

98 

45 

87 

68 

67 

54 

78 

33 
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可以应用第5章的公式 5. 1计算皮尔森相关系数。具体计算时你会 
得到的结果是 r = . 393。现在我们按步骤检验这个值的显著性，并且确定 
这个值的含义。 

下面是著名的八个步骤和检验统计 M 的计算。 

1,零假设和研究假设的表述。零假设是婚姻质量和父母-子女关系之 
间没有关系。研究假设是双侧的无方向的假设，因为研究假设只是陈述两 
个变量之间有关系，而方向并不重要。记住相关可能是正向的或负向的， 
但相关系数最重要的特征是它的绝对值大小而不是符号 （ 正或者负）。 

零假设如公式 13. 1 所示： 

^0 ： Pxy ( 13 . 1 ) 

希腊字母 p 或 rho 表示相关系数的总体估计。 

研究假设（公式 13.2 所示〉 表示两祖值之间有关系，而且这个关系值 
不等于0。 - 



^0 




验？ ■果是检 j 



间的差 



单侧还是双侧 

… 将单 侧检验或双侧检验概 念化。 而且对你来说也很容 

,讀相关系数的双侧频任何 ■于 零值的麟都要检軌 
1〗观甚廉翻枪验呢？其实也很容易 m 对于假定夹系存在的研究 

的检验可以断定关系是正向 的或负 向的。因此， 


j 如果你 





L 为两个变 


■V- -V y .： ； I ■ ■ -v > V.-, 

㈤ 減，那减麟細 




没有 

ml 

■- . 






了单佩 
.侧检验 






r ” 膝 ㈣ 


2. 设置零假设的风险水平 （ 或显著性水平，或第一类错误）。风险水 
平或第一类错误或显著水平是 . 05 。 

3. 和 4. 选择合适的检验统计量 o 使用图 13. 1所示的流程表，我们确 

定用于相关系数的合适的检验。在这个案例中，我们不需要计算检验统计 
M , 因为简单的/•值 （ \ . 393 ) 就我们的检验 S 的来说就是我们的检验统 

计量。 

5. 使用特定统计 M 的合适的临界值表来确定拒绝零假设需要的值。 
附录 B 的表 B 4 列出了相关系数的临界值。 

首先我们要确定自由度 （#) ，自由度近似样本规模。就现在的检验统 
计量来说，自由度是 n -2,或者29 -2 =27,其中 /I 等于用于计算相关系数 
的配对数 M 。 这里的自由度只适合于这项统计检验，但不是其他统计检验 
所需要的。 

使用自由度数值 （ 27 )、你愿意承担的风险水平 （. 05 ) 和双侧检验（因 
为研究假设没有方向），临界值是 . 349 ( 使用# = 30,30是最接近的数字）。 
因此对显著水 f 为. 05 、 自由度为27的双侧检验来说，我们拒绝零假设需 
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万卷方势 
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耍的值是 . 349 



好了，我们有点儿投机取巧。实际上你可以计算 f 值（类似于 
不同均值之间差异的检验）检验相关系数的显著性。 汁算 公式并 
不比之前几章学到的公式难，但是你不会在本章看到。重点是一 
些聪明的统计学家已经计算了在不同显著水平下 （. 01，• 05) 不同 
样本规模的单侧检验和双侧检验临界 r 值，就如表 B 4 所示。如果 
你在读专业期刊时看到过使用 i 值检验相关关系，现在你知道这是 


为什么了吧。 


6 - 比较实际值和临界值。实际值是_ 393,拒绝零假设也就是两个变量 
不相关的临界值是.349。 

7•和8.做出决定。现在我们该做岀决定了。如果实际值（或者检验 
统计 U 的值）大于临界值 （ 表中列出的值）就不能接受零假设。如-果实际 
值没有超过临界值，零假设就是最有力的解释。 ’ 

在这个案例中，实际值 (. 393 ) 超过临界值 (.349) -~-这个值足够大， 

我们可以说两个变量 （ 婚姻质量和父母-子女关系）之间确实存在由于随 
机因素之外的某些因素引起的某种关系。 


即么如何鮮幹 r 27 、393 ，p < . 05 


• r 表示我们使用的检验统计童。 

•2*7 是自由度数值。 

• • 393是实际值，是使用第 5 章给出的公式计算所得的值。 

• /> < . 0 5 ( 实际上是这个简短表达式中最重要的部分）表示对零假设 
的任何检验来说,两个变量之间的关系是由于随机因素引起的可能性小于 
5%。因为我们以 . OS 作为研究假设比零假设更冇解释力的标准，我们的 
结论就是两个变量之间的关系是显著的。这意味着随着婚姻质量水平的 
提高父母-子女关系的水平也提高^相应的，随着婚姻质最水 f : 的降低父 
母-子女关系的水平也降低。 



相关系5以用 


. ..多^同的目的，而且你可能在一些文 i 

乾中着到相果系数用于估计检验的信度。使用相关系数的信^ 
木几 种不同的类型，如再测信度 (两 个不同时点数据的相 

一崩！复 j 

i 致性倌度(项肖之间的内在相类鋥清 I 我扪在讨论信度 i 




J 生4吕廣瑣目之^! 

I：! - 

洗的第16 章继续讨论 
析，这些都是相关系数 


、口 1释 WV , 目关 
同形式的数据之间的相关程度）和内在 

1“.:: 夸 
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因果和相共（再次说明） 

你可能认为你已经对因果和相关有了足够的了解，但是这一点太重要 
了，因此我们不得不再中明一次。仅仅因为两个变 M 相互相关（类似上面 
给出的案例），并不表示一个变 M 变化就引起另一个 变黾的 变化。换句话 
说，婚姻质量高并不能保证父母-子女关系水平也高。这两个变量可能因 
为共享共同的一些使得一个人成为好丈夫、好妻子或好父母的特质（耐 
心、领悟力、牺牲的意愿）而相关, 但是乜 仃相当的吋能看到好呰吋以成为 
好丈夫或好妻子的人与子女的关系相当糟糕。 

是否还记得第5章的犯罪和冰淇淋的案例？在本章也一样。仅仅因 
为变量相关并分享一些共同的特征并不表意味着这两个变量之间存在因 
果关系 D . 


夏著性和意义（强调，—灰又—走) 


在第5章我们对使用决定系数理解相关系数的意义进行了评述。你 
口 r 能记得相关系数的平方可用十确定一个变量的方差可以解释另一个变 
量方差的程度。在第 8 章我们也讨论了显著性与意义的问题。 

但是我们需要再一次讨论这个主题即使相关系数是显著的 （ 就如 
本章的案例），并不意味着町以解释的方差的程度是有意义的。例如，在 
这个案例中，简单皮尔森相关值 .393 的决定系数等于.154,这表明可以解 
释方差的15,4% »而方差的 84. 6%不能解释。这就留下了很大的质疑空 


间，对吧？ 

因此，即使我们知道婚姻质量和父母-子女关系之间有正向的关系，这 
两个变摄可能“走”在一起，但是这么小的相关系数 .393 表明在这两个变 
量的关系中还有其他很重要的因素在发挥作用。因此，你可能会想到统计 
学中的一句谚语，“你看到的并不总是你得到的％ 


使用计算机计算相关系数 



现在我们使用第13章数据集1 ( chapter 1 3 dala set 1 ) ，这个数 

据集屮有两个测 M 指标-个是婚姻 （ 共度的时间，有三个分类 

项目），另一个是父母-子女关系（影响力）。 

1.在数据编辑栏录人数据（或打开数据文件）。要确保每一个 
变遣对应一列。在图 13.2 中你可以看到每一列开始的标签分別 
为 qual __ mar ( 婚姻质量）与 qual „ pc ( 父母-子女关系 ） 0 




Bivariate Correlations 


^quaLmai 


r ^ 








4 J 




• ••级 


藏 1 


2. Analyze—►Correlate — ^Bivariate 

Bivariate Correlations 对话框 p 


^ iVafiabies 


Reset 


P* P 纖如厂 Kendall's tau 


sm. 

Sp©3rrfl3jnj ； 


图 13. 3 双变量相关分析对话框 

3, 双击变量 quaUpc 将变量移到 VariableU ) 框中 
量 qual_pc 将变量移到 Variable( s) 框中。 

4. 点击 Two-tailed 进彳 T 双侧检验。 
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5. 点击 OK 。 SPSS 执行分析过程然后得出图4所示的 
结果。 


—■ Correlations 


Correlatioiifi 



QUALJWAR 

QUAL.PC 

'QUAL_MAH Pearson Corrfilation 

I 

.024 

Sig-(2-tailed) 

«■ 

Ml 

N 

36 

36 

QU AL_P(1 i Parson Correlation 

.024 

1 

Sig»(2-tailed) 

,891 

» 

N 

36 

36 
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相关系数显著性检验的 SPSS 输出结果 


SPSS 输出结果的含义 


SPSS 的输出结果简单明确。 

两个变量之间的相关系数是 . 024 ， 在 • 05 的显著水平下是不显著的， 
但是更准确地说就是犯第一类错误的概率是 .S9 1。这意味着零假设为真 
( 两个变量不相关）的情况下拒绝零假设的可能性是 89. 1 % — 一这可是很 


可怕的概率。 

mammm mmmm —— 圆 




小结 

相关系数是指出关系的方向并帮助我们更好地理解两个结果变量共享的内 
容的重要工具。要记住相关只适用于相互关系而不是因果关系。 


练习时间 

1. 参照下面给出的信息，使用附录 B 的表 B 4 确定相关系数是否显著，以及 
如何解释结果。 

a . 20个妇女的速度和力量之间的相关系数是 J 6 7 。 在 .05 的显著水平下使 
用单侧检验来检验结果。 

b . 数学考试中回答正确的问题数量和完成考试的时间之间相关系数是 
-.45。在 .05 的显著水平下检验80个孩子的相关系数是否显著 D 选择单侧检 

验或双侧检验，并给出解释 

c . 50 个青少年朋友的数量和平均成绩 （ GPA ) 之间的相关系数 . 37。在 . 05 
的显著水平下双侧检验是否显著？ 

2. 使用第13章数据集 2( chapter 13 data 2 ) 回答下面的问题。手动计算或者 
使用 SPSSo 
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a . 计算动机和 GPA 之间的相关系数。 

b . 使用双侧检验在 .05 的显著水平下检验相关系数是否显著。 

c . 正确或错误？动机水平越高就越愿意学习。你的选择是什么并解释。 

3. 讨论并举例说明 （ 类似冰湛淋和犯罪的例子） ：两个 变量相关就意味着一 
个变量的变化会引起另一个变量的变化。 

练习参考答案 

( a . 自由度是 18(df=n -2) 、显著水平是 .05 的情况下拒绝零假设的临界值 
是 ■ 516。速度相力量之间是显著相关，而且相关系数解释方差的 32. !5%。 

lb . 自由度是78、显著水平是 • 05的情况下单侧检验拒绝零假设的临界值 
是.183。所以正确的数量和完成时间之间显著相关。因为研究假设变量间关系 
是负向的，所以使用单侧检验，而且大约解释方差的20%。 

1 ( :.自由度是48、显著水平是 . 05的情况下双侧检验拒绝零假设的临界值 

是.273。所以朋友的数量和可能取得的 GPA 之间显著相关，而且相关系数可以 
解释方差的13.69%。 

2 a 与 2 b . 我们使用 SPSS 计算得出相关系数为 0.434, 显著水平为 .017 的双 
侧检验是显著的。图 13.5 给出最后的分析结果。 - 

Correlations 

Correlations 



MOTIV 

GPA | 

MOTtV Pearson Correlation 

l 

,434* 

Sig, (2-latied) 


,017 

N 

30 

30 

CPA Pearson Correlation 

*434* 

1 

Sig* (2-iailed) 

.017 


N 




30 

30 


•.Correlation ja significant at the 0.05 level (2-tailed) 


图 13. 5 第 13 章数据集 2 的 SPSS 输出结果 

2 c _ 正确。动机水平越高越愿意 学习； 而且学习越多，动机水平也越高。但 

是（很重要的“但是”）更多的学习并不能引起更高的动机水平，同样的更高的动 
机水平并不能导致更多的学习。 


3 .这个 案例是学习的时间和第一次统计学考试成缋。这两个变量不是因果 
上相关。例如，你的同学因为不理解内容，即使学习了几个小时，但是学习效果 
很差，而有的同学可能在其他课程学习了同样的内容，即使不学习也绩也很好。 
假设我们强迫一些人在考试前四个晚上坐在书桌前每晚学习10个小时，这能保 

证他或者她得到好的成绩？当然不能。不能因为变量相关就认为其中一个变量 
的变化就会引起另一个变量的变化。 





预测谁将赢得超级杯 
—使用线性回归 
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• 如何进行估计，估计如何应用在社会科学和行为科学中 



以一个变量估计另一个变量时如何以及为什么进行线性回归 


• 如何判断估计的准确性 
• 多元回归的应用 


什么是估计 


现在简短地介绍一下。你不仅可以计算两个变量相关的程度（就如 
在第 5 章一样计算相关系数），也能够以相关系数为基础通过一个变量的 
值计算另一个变量的值。这是如何应用相关的非常特别的案例，而且相关 
是社会和行为科学研究者的强有力的工具。 

估计的基本含义就是使用巳经收集的数据集（如变量 x , r 的数据）， 
计算变量如何相关，接着使用相关系数以及 x 的信息来估计 y 。 听起来有 
些难？实际上不难，特别是通过例证对估计有了了解之后。 

例如，研究者收集了 doo 个州立大学的学生高中时期所有的平均成绩 
(GPA )和大学第一年的 GPA 。 他计算丫这两个变量之间的相关系数。接着 
他使用你将在本章学到的统计技术，利用新的 々 OO 个学生样本的高中 GPA 
( 已经从之前的学生数据集了解高中 GPA 与大学第一年的 GPA 有关系）估 
计大学第一年的 GPA 。很好用，对吧？ 

这儿还有另一个案例。 一 些教师对留级发挥的作用感兴趣。也就是 
一些孩子留在幼儿园（没有进人一年级）是否比进人一年级 更好？ 这些教 
师知道留级和一年级的成绩的相关 系数; 他们可以将相关系数应用到新的 
学生样本并依据幼儿闲的成绩估计一年级的 成绩。 这样行得通吗？很容 
易。收集过去事件（如两个变 M 之间现存的关系）的数据，然后在只知道 
— 个变量的情况下应用到未来的事件中。这要比你想象的容易。 
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卷贪诔 
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本章的内容就是详细了解线性回归过程以便通过尤值估计 y 值。我 
们从估计的一般逻辑的讨论开始，接着评述一些简单的绘制线性图的技 
能，最后以具体的案例讨论估计过程。 


估计的逻辑 


在幵始实际的计算并展示如何使用相关进行估计之前 t 我们先讨论为 
什么以及如何估计。接着我们继续使用以高中 GPA 估计大学 GPA 的案例。 

估计是以过去的结果估计未来结果的活动。当我们想通过一个变量 
估计另一个变量，我们首先需要计算两个变 M 之间的相关系数。表 14. 1 

给出这个案例中使用的数据。图 14. 1是将要计算的两个变 M 的散点图 
(见第5章）。 


表 14.1 

高中 GPA 和大学第一年 GPA 相关 

高中 GPA 

大学第一年 GPA 

3*50 

3,30 

2.50 

， 2. 20 

4.00 

3.50 

3.80 

2.70 

2,80 

3. 50 

1,90 

2.00 

3.20 

3. 10 

3.70 

3.40 

褥 

2,70 

L 90 

3,30 

3,70 


要以高中 GPA 估计大学 GPA ，我们必须建立回归等式 （regression 
equation ，并使用这个等式建立回归线 （regression line )。 岡归线反映我们 
以变量 I 的值（高中 GPA ) 估计变量 y 值（大学 GPA ) 的最好猜测。对表 
14. 1中所示的所有数据来说，回归线使得回归线和被估计变量 K 的数据 
点之间的距离最小化。你会很快学会如何绘制图 14.2 所示的冋归线。回 
归线表示什么？ 
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♦ 


♦ 


争 


争 


争 
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♦ 
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2.5 


30 


3.5 


— I 

4.0 


高中 GPA (X) 


图 14. 1高中 GPA 与大学 GPA 的散点图 
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y 对 ; tr 的回归线 
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争 


# 




♦ 


2,0 


2.5 


3.0 


3.5 


4.0 


高中 GPA {X) 

Wt 

图 14.2 大学 GPA 对高中 GPA 的回归线 

首先这是变撤 k 对变量 I 的回归。换句话说， r (大学 GPA ) 将依据 x 
(高中 GPA ) 被估计。回归线也叫做最优拟合线 （line of besl fit )。 回归线 
最好地拟合了数据，因为这条线将每个数据点与回归线的距离最小化。例 



q 




5 

0 


Q) vdo#¥ 


E vdo 翁 -K 



爱上统计学 


如，你考虑所有的数据点并尽量寻找可以同时拟合这些数据点的直线，你 
会看到图 14.2 中所示的直线就是你要用到的直线。 

其次，这条直线可以用于进行最好的猜测（已知高中 GPA 的情况下对 
大学 GPA 进行估计）。例如，如果高中 GPA 是3.0,那么大学 GPA 就大概 
( U : 住，这只是看图示大概估计）是 2. 8。 看图 14.3 你就会了解我们是怎 
么估计的。我们先在$轴定位估计值 （3.0) ，然后绘制从$轴到回归线的 
垂直线，接着绘制水平线到; T 轴并估计对应值的大小。 



pre 


图 M .3 给定高中 GPA 估计大学 GPA 

第三，每一个具体数据点和回归线的距离就是估计误差 （error ir 
diction ) ——^是两个变量之间相关的直接反映。例如，你看到的数据点 
3. 3 ,3. 7 ( 图 14. 4 中所示)，这是在回归线上方的 U 数据点。这个数据 
点和回归线的距离就是估计误差，就如图 14.4 中所标注的一样。那么如 
果是完全估计，所有估计的数据点会落在什么位置？刚好就在回归线或估 
计线之上。 


第四，如果是完全相关,所有的数据点将沿着45。角成为一条直线，而 
且回归线通过每一个数据点（就如上面的第三点所讲）。 

给定回归线之后，我们可以使用回归线估计任何未来的值。这」 I :是我 
们要做的——建立回归线然后进行估计。 
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1,5 2.0 2.5 3.0 3.5 4.0 


髙中 GPA (X) 

图 14.4 怙计很少是完全估 计:估 计误差 

绘制拟合数据的最优直线 

理解估计的最简单的方式就是依据一个变量值（我们称为 X ——独立 
变量 , independent variable 或估计变量， predictor ) 确定另一个变量的值（我 

们称为 ^ -依赖变董 ， dependent variable 或标准变量， criterion 。 

我们发现很好的利用 X 估计 F 的方式就是建立本章之前提到的回归 
线。回归线依据我们已经收集的数据建立。接着利用等式以 X 或估计变 
量的新的数值进行估计。 

公式 14. 1所示是回归线的一般公式，这个公式在高中或者大学的数 
学课程中都可能用到，对你来说应该很熟悉。这个公式与其他任何直线公 
式一样。 

r - bX + a (14. 1 ) 

其中 

r 表示已知 x 值的 y 的估计值。 
b 表示直线的斜率或者方向。 
a 表示直线与 y 轴相交的点。 

X 表示用于估计的数值。 

现在我们使用之前表 14. 1中列出的相同数据进行一些必要的计算。 
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X 

Y 

X 2 

Y 2 

XY , 

3-50 

3,30 

12.25 

10.89 

11-55 

2,50 

2.20 

6.25 

4.84 

5.50 

4.00 

3.50 

16.00 

12.25 

14,00 

3.80 

2,70 

14,44 

7,29 

10,26 

2-80 

3.50 

7,84 

12,25 

9.80 

K 90 

2,00 

3.61 

4. 00 

3,80 

3,20 

3.10 

1( X 24 

9-61 

9*92 

3*70 

3.40 

13.69 

11.56 

12.58 

2.70 

1,90 

7.29 

3-61 

5. 13 

3-30 

3,70 

10.89 

13-69 

12,21 

总计 33,4 

29,3 

102. 50 

89.99 

94.57 


或所有 A 值的总和是 31. 4。 

或所有^值的总和是 29. 3。 

或每个 X 值的平方和是102.5。 

Z 3 " 2 或每个^值的平方和是 89. 99。 

Xir 或所有尤值和^值乘积的和是 94. 75。 

公式 14.2 用于计算回归线的斜率（直线公式中的 6) : 

b X 灯 ~ ( X ^ Z y/fl ) 

" 1^ 2 - [( 1 ^) 2 /«] 

在公式 14.3 中你可以看到直线斜率6的计 算值。 

b = 94. 75 - r (31.4 x 29.3)/101 
_ 102^ 5 - [ (31.4) VlO ] 


2.748 一 
3,904 = 


704 


(14.2) 


(14.3) 


公式 I 4 . 4 用于计算直线与 y 轴相交的点（直线公式屮的 a ) : 


一 I Y -blX 
0 ― 

ft 

在公式 14.5 中你可以看到直线截距 a 的计算值。 

a 一 29,3 - (,704 X 31.4) 

a 一 ^ To ~ 


(14.4) 


(14.5) 


7. 19 

a — -』 

10 


719 


现在回到直线的等式 + a ) 并代入具体的《值和6值，最后的 
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回归直线就表示为： 

Y f = . 704 X +. 719 

为什么是 P 而不只是 F ? 记住，我们用 X 估计 h (读作 F 撇） 是估 
计值而不是实际的 F 值。现在我们已经建立了等式，接下来我们能做什 
么？估计 F ， 还有其他吗？ 

例如，我们可以说高中 GPA 等于 2.8( 或; T =2.8) ，如果我们将 2. 8 这 
个值带人等式，就会得到下面的公式： 

Y * =.704(2. 8) +. 719 = 2 . 69 

因此 2, 69 就是 X 等于 2. 8 时 K 的估计值（或 r ) 。因此对任何的 X 
值我们可以很容易地快速计算 F 的估计值。 



并不是所有的最优拟合数据点的回归线都是直线。回归线可 
能是曲线，就如我们在第5章讨论的 ，变遛 间的关系是曲线关系。 
例如焦虑和成绩之间的关系就是曲线关系，也就是当人们完全不 
焦虑或者非常焦虑时，他们的成绩都不好。只有他们的焦虑适度, 
成绩才能最大化。这两个变量之间的关系就是曲线关系，所以在 
以 I 值估计 F 值时要考虑。 


我们的诂计有多好 

如何测量我们依据一个结果估计另一个结果的工作完成的好坏？我 
们知道两个变■之间的相关系数的绝对值越大就越能很好地进行估计。 
理论上说这很好。但是就实际估计而言，在我们首次计算回归线的公式时 
我们也能够看到估计值（ r ) 和实际值（ y ) 之间的差异。 

例如，如果回归线的公式是 K . 704 ( 2 . 8 ) + . 719,义值为2 . 8的 y 的 
估计值 （ F ) 是. 7 04(2. 8 ) +. 7 19或2.6%我们知道对应 X 值的实际 F 值 
是 3. 5( 见表 i 4. 1所示的数据集 h 3.5 与 2. 69之间相差.81，也就是我们 
所知道的估计误差 （ error of estimate )。 

如果我们考虑所有的偏差，我们可以计算每一个数据点偏离于估计的 
数据 点的平 •均数童:，即标准估计误趋（ standard error of estimate 。 这个值 

告诉我们估计的不准确性程度。就如你可以想到的，两个值之间相关程度 
越高（估计也越好），估计误差就越小。实际上，如果两个变童之间完全相 
关 （ +1或-1)，标准估计误差就是0。为什么？因为是完全佔计，所有的 
实际数据点都落在回归线上，以 X 估计 F 的过程中没有误差。 










Case Labels 


Independentfs): 




图 1屯5 线性回归对话框 

3 -点击变量 injureis , 然后点击►将选中的变 量移到 Dependent Varia 


㈣ 




training 



使用计算机计算回归线 


我们可以使用 SPSS 在以 I 估计 F 的过程中计算冋归线。我 
们使用的数据集是第； 4 章数据集1 ( Chapter 14 data 1 ) Q 我们以训 
练的时间估计踢足球过程中受伤的程度。 

下面就是数据集中的两个 变量： 


变量 

定义 

训练 (training) (X) 

受伤 （ injureis) (Y) 

每星期力量训练的小时数 
以 1-10 为测量等级的受伤程度 


下面给出计算本章讨论的回归线的步骤 
1- 打开数据文件第14章数据集1。 

2. ，存击 Analyze — Regression —► Linear 。 你 


按照这个顺序实际操作 


Regression—Linear 。 你就会看如图 14*5 所示的 Lin 


Regression 对话框 
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bles 框中^这个变最是依赖变量，因为它的值依赖训练的时间。这个变童 
也是被估计的变量。 

4. 点击变量 training , 然后点击►将选中的变童移到 Independent V aria - 
ble 框中。 

5. 点击 OK ， 你会看到如图 14.6 所示的部分分析结果。 



图 14.6 SPSS 分析结果 

待会儿我们会解释输出结果。首先，我们应用 SPSS 在这些数据的散 
点图上绘制回归线，就如在图 14.2 中所看到的一样。 

6* Graph Sc at te r . 

7* 点击 Simple ， 然后点击 Define , 你会看到 Simple Scatterplot 对话框。 

8. 点击变量 injuries , 然后点击►将选中的变 M 移到 y - axis 框中。记住 
y 轴表示被估计的变量。 

9 . 点击变量 training ， 然后点击►将选中的变量移到 x - axis 框中。 

10. 点击 OK ， 你会看到如图 14.7 所示的散点图。 



0 10 20 30 40 


TRAINING 


图 14.7 使用 SPSS 建立的散点图 











TRAINING 

图 14. 8 附带回归线的散点图 

SPSS 猞出结果的含义 

SPSS 的输岀结果可以告诉我们几点。貧先，回归线的公式依据图 
I 4 . 6所示的输岀结果设定.是 F = - 125尤+ 6. 847。这个等式可以在给定 
力最训练的小时数的情况下佔计受伤程度。实际上，就如在图 14. 8中肯 g 
看到的，回归线的斜率是负值，也反映出训练时间和受伤程度之间负相关 
(- .458) 0 因此，依据现在给出的数据，结果就是训练时间越多受伤就越 
轻微。 


估计变量越多就越好？也许是…… 

本章我们使用的所有案例都是一个结果变量和一个估计变童。 有些 
情况下回归使用不止一个估计变量或独立变量估计一个特定的结果。如 

果一个变最能够以一定的准确性估计一个结果，那么两个变 M 是否能更好 
地估计？ 

例如，如果高中 GPA 是大学 GPA 很好的指示器，那么高中 GPA 加上 


!78 


万卷方详 


爱上统计学 


现在绘制回归线。 

I -双击散点图，选定之后进行编辑。 

2* 点山 hart—Options, 你就会看到 Scalteii lot Options 对话框 
3 •在 Fit line 区域点击 Total 。 

4. 点击 OK ， 附带回归线的散点图如图 14.8 所示。 


10 







14 预测谁将赢得超级杯——使用线性回0 


179 


课外活动数 M 呢？问妇模细从 f - bX + a 变成 F = +从 2 + «, 

其中 

A： t 表示第一个独立变量的数值 
X 2 表示第二个独 立变量 的数值 
b 表示特定变量的回归权重 

与你猜测的一样，这个模型就是多元回归 （multiple regression )。 因 
此,在理论上说就是以两个独立变量而不是一个来估计结果。但是只有在 
某些条件下你才会想增加另外的独立变量。 

首先，你增加的任何变 M 对于理解依赖变 M 有独特的贡献。 r 1 「则 为什 
么使用？我们所说的独特是什么含义？附加变讀需要解释第一个估计变 
量不能解释的被估计的变量的差异。也就是说这两个变量综合起来可以 
比任何一个变最单独估计更好地估计 y 。 

在我们的案例屮，参与课外活动的水平可以做岀独特的贡献。那我们 
是否可以增加一个变量如每个高中生的学习时间作为第三个独立变量或估 
计变量？因为学习时间与 （; pa (我们的另一个估计变量）的相关程度很高， 
所以学 习时间 对于估计大学 GPA 不能提供更多信息。因此寻找另外的变量 
( 例如推荐信的级别）可能比花费时间收集学习时间的数据更为有效。 

使用多元估计史量座遵#的重要原则 

如果要使用不止一个估计变量，要谨记遵守下面的两项重要的 原则： 
i - 如果选择一个独立变量估计一个结果，要选择与被估计变量 （ >0相关 
的估计变量 U ) 。也就是这两个变量有共变的部分 （ 记住,它们应该相关）。 

2. 如果选择不止一个独立变量或估计变量（如尤^与，要尽 M 选 
择相互独立或者不相关的变童，但是都要与结果变童或被估计变量 （ K ) 
相关。 

实际上，你只想要独立变 M 或估计变量与依赖变相关，而彼此不相 
关。也就是每个独立变量尽可能在估计依赖变量或被估计变量时做出独 
特的贡献。 



多少估计变量会嫌多？如果一个变量可以估计结果，而且两 
个变域就会更准确，那么为什么不选3个、4个或5个估计变量? 
就实际操作而言，每增加一个变 M 就相应增加费用。一些人必须 
去收集数据，这就要花费时间 （ 就研究预算而言就要有很大的花 
费），等等。就理论上而言，使用多少变置可以有助于理解我们要 
估计的结果有硬件的限制。问题是一旦你选择了3卜或4个变 
量，变量之间很少不相关。准确保守的估计比包含太多变量、浪费 
太多资金和功效的估计更有优势。 
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j 卷方诸 


爱上统计学 



小结 


估计是简单相关系数的特殊应用，而且是检验复杂关系的非常有力的工具。 
速可能使得本章比其他各章要难一些，但是你会受益于你的所学，特别是当你能 
够将此应用到你所阅读的研究报告和期刊文章中时。随着有关推论统计的大多 
数章节的结束，我们可以进一步将统计技术应用到样本规模非常小或者假定其 
数据分布不是正态分布的样本中。 


练习时间 

1.第14章数据集 2( chapter 14 data 2 ) 是一个群体参与定时测试的数据。数 
据是参与者完成每一个项目的平均时间（反应时间），以及项目正确的数量（正确 
数量）。 

a. 给出依据正确数量估计反应时间的回归等式。 


b . 如果正确数量是8,估计反应时间。 

c . 对每一个估的反应时间来说实际的正确数量和估计的正确数量之间的 


偏差是多少？ 

2. 贝特斯对估计有多少75岁的老人会患老年痴呆病感兴趣，并以教育水平 
和10级测量的一般健康状况作为估计变量。但她也对其他估计变量感兴趣。 


回答下面的问题。 

a . 在选择其他估计变量时应遵守什么标准，为什么？ 

b . 定义其他两个可能与老年痴呆病发病相关的估计变量。 

c . 如果选择四个估计变量（教育水平、一般健康状况以及你定义的两个新的 

变量），给出可能的回归等式。 

3. 去图书馆，在你感兴趣的领域的研究中选择三个不同的线性回归的案例。 
如果研究包含不止一个估计变量也可以。对应每个研究回答问题。 

a . 哪一个是独立变量，哪一个是依赖变量？ 

b . 如果有不止一个独立变量，关于变量之间是否相互独立研究者进行了患 


样的讨论？ 

c . 三个研究中哪一个提供的表明依赖变量是依据独立变量进行估计的证据 
最少，为什么？ 

4. 现在应用本章提供的信息并获得预测超级杯胜利者的机会。乔教练非常 
想知道一年中比赛胜利的平均次数是否可以预测超级杯的成绩（胜利或失败）。 
变 量尤是 在过去10个赛季赛事胜利的平均次数。变量 K 是过去十个赛季某个 
队是否获得超级杯。下面就是给出的 数据： 





14 预 瀏谁将 赢得趦级杯——使用线性囵归 


181 


队伍 

过去十年赛事胜利的 
平均次数 

是否贏得超级杯 
( 1 = 是， 0 = 否） 

Savannah sharks 

12 

1 

Pittsburgh pelicans 

11 

0 

Williamstown 

15 

0 

Bennington bruisers 

12 

I 

Atlanta angels 

13 

1 

Trenton terrors 

16 

0 

Virginia vipers 

25 

1 

Charleston crooners 

9 

0 

Harrisburg heathens 

8 

0 

Eaton energizers 

12 

1 


a * 如何评价赛事胜利的平均次数作为队伍是否赢得超级杯的估计变量的有效性? 
b . 使用分类变量（如1或 0) 作为依赖变量的优点是什么？ 

C , 其他的可用于估计依赖变量的变量有哪些？为什么选择这些变量？ 

练习参考答案 

la , 回归等式是 r = - .214( 正确的数量） +17.202 

lb . r = « .214(8) +17*202 = 15.49 0 


时间 （ y) 

正确数量 (X) 

r 

Y-Y f 

14.5 

5 

16. 13 

-1.63 

13-4 

7 

15.70 

-2.30 

12,7 

6 

15.92 

»3,22 * 

16,4 

■ 2 

16.77 

-0.37 

2K0 

4 

16,35 

4,65 

13.9 

3 

16,56 

-2.66 

17.3 

12 

14.63 

2.67 

12.5 

5 

16*13 

-3.63 

16.7 

4 

16 . 35 

0,35 

22.7 

3 

16.56 

6, 14 


2 a . 其他的估计变量不能和任何一个估计变量相关。只有这些变量相互独 
立才能够在估计依赖变量或结果变量时提供独特的贡献。 

2 b . 例如，生活安排（单独过或者与他人一起生活)和获得医疗服务的机会 
(高、中和低）。 

2 c . 老年痴呆病的存在=(教育水 平）; + ( —般健康状况+ ( 生活安 
排）尤 m + (获得医疗服务的机 会 ）！ m +〜 

3.自己来完成。 

4 a . 计算这两个变量之间的相关系数，是.204。依据第5章的信息，这样的 
相关系数值比较低。你可以得出的结论是胜利次数不是队伍是否赢得超级杯的 
很好的估计变量。 

4 b . 许多变量依据属性特征（性别 、种族 、社会阶级和党派）分类，并且很难依 


据类似 I 〜 KX ) 的等级进行测 


使用分类变景可以给我们很大的弹性空间 


4 c . 其他的变量可能是全美球员的数量、教练的输/赢记录和家庭护理 
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非参数统计的筒要介绍以及何时、如何使用非参数统计 


非参数统诗的介绍 

到现在为止我们在《爱上统计学》这本书中介绍的每一种统计检验方 

法儿乎都假定你所使用的数据集都有确定的特征。例如，支持均值（独立 

均值与不独立均值）之间 f 检验的一个假定就是每个群体的方差是齐性 

的，或者是类似的。而且这项假定可以检验。大多参数统计 （ P arametr i c 

stati st fcs ) 的另一项假定是样本要大到足以代丧总体。统计学家已经发现 

样本规模达到30就可以满足这项假定 D 到现在我们已经学过的许多统计 

检验都是稳健的或者强有力的，即使这些假定之一已经不成立但是检验仍 
然有效。 

似如果上述假定都不成立•你将怎么做？最初的研究问题肯定 只得继 
续提出并回答 & 这就是我们使用非参数统计 （ nonparamel iic statistics ， 也口 L { 
做自由分布统计）的时候。这些统计检验方法不遵循相同的“ 规则，，（也 就 
是不需要和我们已经评述的参数检验一样的假定），可也同样很有价值。 

非参数检验的使用还可以让我们分析频数数据，例如不同年级的学生数童 
或得到社会保障的人口比例。 

例如，如果你想知道最近的选举中赞同教育券的投票人数是否符合你 

的随机预测，或者是否真的存在偏好模型，那么我们就使用非参数统计也 
就是卡方检验。 

在这一章我们介绍卡方检验-最常用的非参数检验之一，还要简要 

地介绍其他非参数检验方法，这样你就会对可以用到的一些非参数检验方 
法有一定的了解。 
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单祥本卡方检验介绍 

卡方是很好的非参数检验方法，可以用于确定你在频数分布中观察到 
的结果是否就是你随机预期的结果^单样本卡方只包括一维，就如你在这 
■看到的案例。双样本卡方检验包括两个维度，例如赞同教育券是否独立 
于政党背景和性别。 

例如，这里的数据是随机选自加州索诺玛郡1990年人口调查的一个 
样本数据。就如你所看到的，这个表以不同教育水平划分数据。 



教育水平 



没有上大学 

匕了大学 

获得学位 

总计 

25 

42 

17 

84 


这里的问题是回答者的数 M 是否在各个教 ff 水平等量的分布。要问 
答这个问题就要计算卡方值并进行显著性检验。在这个案例中，卡方值等 
于 11. 643,这个值在 .05 M 著水平下是显著的。结论就是这个案例中回答 
者在不同教育水平的分布不是等量的分布。换句话说，这不是我们随机预 

期的结果。 _ 

单样本卡方检验的原理是，就任何事件的发生而言都可以很容易地计 
算随机预期的结果。你可以通过事件总体发生的数量除以层级或者分类 
的数量实现。在我们的人口调査样本中，观察到的事件发生的总的数量是 
84。我们随机预期84/3或28个（频数的总和84除以分类的总数3 ) 回答 

者分别落在教育水平的三个分类中。 

现在我们来看我们随机预期的数 M 和实际观察的数量的差异程度。 
如果预期的数量和实际观察的数量没有区别，卡方值就等于0。 

接下来让我们具体地了解如何计算卡方值。 

计算卡方检验统计量 

卡方检验要进行观察值和随机预期值的比较。公式 I 5 . L 就是单样本 
卡方检验的卡方值计算公式。. 

X 2 = I (15-1) 

其中 

% 2 表示卡方值 
X 是连加符号 
o 表示观察频数 ■ 
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表示预期频数 

下面是我们用于计算卡方值的数据。 



对教育券的态度 



赞同 

中立 

反对 

总计 

23 

17 

50 

90 


下面是检验这个统计量的著名的八个步骤。 

1. 零假设和研究假设的表述。公式 15.2 所示就是零假设，表示每一 
分类内事件发生的频数或比例没有差异。 

H 0 • P } = P 2 = P 3 (15,2) 

零假设中 P 表示每一分类中事件发生的百分比。零假设表示分类1 
(赞同）、分类 2( 中立）和分类 3( 反对）中个案所占的百分比相等。我们只 
使用三个分类，如果情况允许这个分类数字可以扩展，只要这些分类相互 
排斥，也就是任何一个观察值只能落:一个分类中。例如，你不能同时既 
是男性又是女性。当然你也不能同时既赞同又反对教育券。 

公式 15.3 所示就是研究假设，表示每个分类中事件发生的频数或百 
分比不同。 

P , _ P t _ (15.3) 

2. 设置零假设的风险水平（或显著性水平，或第一类错误）。第一类 
错误设置在.05。 

3- 选择合适的检验统计量。相互区别的分类（例如赞同、中立和反 
对）的频数和百分比之间的任何检验需要使用卡方。我们之前使用的选 
择统计检验类型的流程表不适合非参数检验过程。 

4. 计算检验统计值（也叫做实际值）。现在回到之前关于教育券案例 
的数据并建立一个数据表用于帮助我们计算 片 方值。 


分类 

t? (观察频数） 

£(预期頻数) 

巩 偏差） 

( 0 - E ) 1 

( 0 - E) 2 /E 

赞同 

23 

30 

一 7 

49 

1.63 

中立 

17 

30 

-13 

169 

563 

反对 

50 

30 

20 • 

400 

13.33 

总计 

90 

90 
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我们依据下面的步骤准备上面的数据表。 

1 一键入各个分类 （Category ) -赞同、中立和反对。要记住这三个 

分类相互排斥。任何数据点只能落在一个分类内。 

2— 键入观察频数 （ 0) ，表示实际收集到的数据。 

3— 键人预期频数（幻，是观察到的频数总和除以分类数 M (3) ，或者 
90/3 = 30 0 

4一对应每一行 （ D ) ，就是观察频数减去预期频数。以预期频数减去观 
察频数也可以，因为这个值在下一步中将进行方。 

5— 计算观察值和预期值差的平方。你可以在（0-£) 2 —栏中看到 

这些值。 • 

6 — 观察值和预期值偏差的 Y 方除以预期的频数 D 你可以在 （ O - 
E) 2 /E 一栏中看到这些值。 

7— 对最后一栏求和，你就会得到总的卡方值 20. 6。 


5. 使用特定统计 M 的临界值分布表确定拒绝零假设需要的值。现在 
我们需要查阅附录 B 的表 B 5, 表 B 5 列出了卡方检验的临界值。 

我们的第一个1 T : 务是确定自由度 （#) ，自由度近似于数据表中的分类 
数量。对现在选定的统计检验错来说，自由度是 r -1， 其中 r 等于行数，或 

3—1 = 2 o 

使用这个数字（ 2 )、你愿意承担的风险水平< 之前定义的 .05) ,你可以 
使用卡方分布表查阅临界值。这个值是 5. 99。因此，在显著水平为.05、 
自由度为2的情况下拒绝零假设需要的值是 5. 99。 

6. 比较实际值和临界值。实际值是 2 0. 6,拒绝零假设也就是在分类 
I 、2和分类3发生的频数相等需要的临界值是 5. 99。 

7 . 和8•做岀决定。现在我们该做岀决定了。如果实际值大于临界值就 
不能接受零假设。如果实际值没有超过临界值，零假设就是最有力的解释。 

在这个案例中，实际值超过临界值-这个值足够大，我们可以说回答者在 

H 个分类中的分布不相等。实际上人们对教育券的选择上，赞成、中立或反 
对的频数分布存在差异^ 



单样本卡方检验有一个常用的名称是拟合优度。这个名称暗 
含的问题是一个数据集“拟合”现存的数据集的程度。当然这个现 
存的数据“集”就是观察到的数据。“拟合”意味着存在另一个可 
以匹配观察到的数据的数据集。标准就是计算 x 2 值的过程中计 
算的预期数据集。如果观察数据能拟合，就是观察数据和随机预 
期数据非常接近，而」丨不存在显著差异。如果观察数据不能拟合， 
就是观察到的数据和预期的数据不同。 
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坪么如何鮮释 % {1) =20. 6 ，p < • 05 

• X 2 表示检验统计量。 

•2 是自由度数值。 

•20.6 是实际值，是使用本章之前给出的公式计算所得的值。 

•P <. 05( 实际上是这个简短表达式中最重要的部分）表示对零假设 
的任何检验来说，投票频数在各个分类中随机等量分布的可能性小 
于，因为我们以 .05 作为研究假设比零假设更有解释力的标准， 
所以我们的结论就是两个数据集之间有显著差异。 

使用计算机进行卡方检验 



下面介绍如何应用 SPSS 进行简单的单样本卡方检验。我们 
使用的数据集名称是第15章数据集1 (chapter 15 data set 1 ) ，这个 

数据集也用在先前的教育券案例中。 

1. 打开数据文件。对于单样本的卡方检验来说，你只需要在 


每一列键入发生的数字，也就是使用每一种可能结果的不同数值。 
在这个案例中，在第1列总共有90个数据点 ：键入 23个 1( 赞同）， 
键入17个 2( 中立），键人50个 3( 反对）。 ， 

2. 点击 Analyze ― ►Nonpammatric Jests ~ ► Chi - Square ，伪;就会着到 

如图15, 1所示的对话框。 







I est Variable List: 


E Kpected Values — 
All categaries equal 

Values: 










图 15.1 卡方检验对话框 

3-双击变量 voucher 。 

4 .点」 「 0 K o SPSS 执彳!分析结果，并产生如图 15. 2所示的 
结果。 
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图15,2卡方分析的 SPSS 输出结果 


SPSS 输出结果的含叉 

^ 方检验的 SPSS 的输出结果明确给出我们之前已经讨 i 仑的内容。我 
们只强调和我们的分析相关的结果。 

丨.将对应观察出现频数 N 按照具体分类——赞同（编码为 1) 、中立 
( 编码为2 ) 和反对 （ 编码为3 ) 列出。 

2. 接着按分类列出预期频数 N ,在这个案例中是90/3，或30 0 

3. k 方值是20.600,自由度在输出结果的 Test Statistics (检验统计量） 
部分中给出。 

准确的显著水平 （在图 中的名称是 Asymp . Sig .) 太小‘小于 . 000 ) 所以 
SPSS 以 .000 计算。一个非常不可能的结果。因此，这三个分类的频数相 
等非常不可能。 

你应该了解的其他非参数检验 

你可能永远 1、 W ; 史卩:签数检验来回答你所提出的研究问题。但是，你 

也可能发现你分析的样本非常小（至少小于 30) 或者数据破坏了支持参数 
检验的一些重要的假定。 =* ' 
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实际上，你想使用非参数统计的最初原因是因为你所研究的 
变量在测量方面的性能。我们在下章会进行更多的讨论，但是就 
现在而言，大多数数据是分类的或者是放在不同的分类中的（例如 
鲨鱼种类和喷气式飞机的种类），或者是定序或等级排序（如第1、 
第2和第 3) 的，它们都需要表 15.1 中给出的某种非参数检验。 

如果是这种情况，可以依据样本规模选择非参数统计。表 
15. 1给出了你需要了解的一些非参数检验的内容，包括名称、使用 
目的和每一个方法应用的研究问题。要记住的是这个表中只给出 
了你可能用到的非常不同的众多检验方法中的一小部分。 


小结 

卡方检验是林林总总的非参数检验中的一种，可以帮助你回答基于破坏了 
正态分布基本假定或者规模太小的数据基础上的问题。这些非参数检验是非常 
有价值的工具，即使现在提供的介绍非常有限，你还是会得到一些帮助 D 


表〗5」分析分类和定序数据的非参数检验 


检验方法名称 何时使用 研究问题示例 


分析分类数据 


检验变化显著性的 McNemar 检验变化的“前和后打电话给对某个特定问题没有做出 
检验 投票决定的候选人的效果如何？ 


Fisher 精确检验 


计算 2 x 2 列联表中每个投掷6枚硬币得到6个正面的准确 
结果的准确槪率 概率？ 


单样本卡方检验（就是本章讨确定不同分类的事件发生 
论的重点） 次数是随机分布的 

分析定序数据 


在最近的销售中品牌 Fmities 、 
Whammies 和 Zippes 的销售量是否 

相同？ 


Koi mogorov-Smimov 检验 

符号检验或中位数检验 


Mann-WhiineyU 检验 
WUcoxon 等级检验 


分析一个样本的数据是否 
来自特定的总体 

用于比较两个样本的中 
位数 

用于比较两个独立样本 


一群小学生选择到哪一所小学去的 
判断是否具有代表性？ 

投票给候选人 A 的群体的收人中 
位数是否高于投票给候选人 B 的 
群体的收人中位数？ 

群体 A 是否比群体 B 的学习转移 
速度快？ 一 ^正确数量测量 


比较两个群体的差异的大 
小和方向 


在帮助儿童语言技能的发展方面学 
前教育带来的效果是否是没有学前 
教育的两倍？ 
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续表 


检验方法名称 

何时使用 

研究问题示例 

Kruskal-wallis —^ 元方差分析 

比较两个或多个独立样本 
的总体差异 

四个地区办公室管理者的等级差异 
如何？ 

弗里德曼 （Friedman ) 二元方差 

比较两个或多个独立样本 

四个地区办公室管理者的性别和等 

分析 

在不止一个维度上的总体 
差异 

级差异如何？ 

斯皮尔曼 （Spearman ) 等级相关 

系数 

计算等级相关系数 

高中最后一年的名次和大学第一 A 
的名次之间的相关系数是多少？ 


练习时间 

1* 使用下面的数据检验问题——最近的选举中民主党、共和党和无党派人 
士的投票人数相同。在 .05 的显著水平下检验假设^手动计算。 


党派选择 

共和党 

民主党 

无党派人士 

800 

700 

900 


2,使用下面的数据在 .01 显著水平下检验问题一一男孩和女孩参加初级足 
球培训的人数相同。（可以从第15章数据集2得到数据。）使用 SPSS 或其他统 
计软件并计算卡方值的准确概率。你的结论是什么？ 

性別 


男孩 


女孩 


45 


55 


3.下面的四个研究问题哪一个适合卡方检验？ 

a. 两个数学班的平均成绩的差异。 

b . 1班通过数学考试的人数和2班通过数学考试的人数不同。 

c . 今年通过碰撞检验的汽车数量与去年通过的数量不同。 
d * 比较橄榄球运动员与足球运动员的100码跑步速度。 

练习参考答案 

1- 下面是计算卡方值的数据表。 
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分类 

0( 观察频数） 

钉预期频数） 

D (偏差) 

(0- E ) 2 

( O - Ef/E 

共和党 

800 

800 

0 

0 

0,00 

民主党 

700 

800 

100 

10 000 

12. 50 

民主人十 

900 

800 

100 

10 000 

12. 50 


自由度为2、显著水平为 .05 的情况下拒绝零假设需要的临界值是 5. 99上实 
际值是25表明我们应拒绝零假设，而且我们得出的结论是不同党派的投票人数 
具有显著性差异。 


2. 下面是计算卡方值的数据表。 


分类 

0( 实际频数） 

耵预期频数） 

£>( 偏差〉 (0- E ) 2 

( O ^ E) 2 /E 

男孩 

45 

50 

5 25 

0.50 

女孩 

44 

50 

5 25 

0.50 


自由度为1、显著水平为 .01 的情况下拒绝零假设需要的临界值是6.64。实 
际值是1表明我们不能拒绝零假设，也就是踢足球的男孩和女孩的数量没有 
差异。 

鬌 

3.问题 b 和 c 适合进行卡方检验，因为收集的数据的属性是分类的。问题 a 
和 d 处理的数据是连续数据（如平均成缋和跑步速度）。 





这就是真相 
——理解信度和效度 



• 什么是信度和效度以及它们为什么重要 
• 这是统计课程，为什么要学习测量的内容? 
• 基本的测量尺度 

• 如何计算和解释不同类型的信度系数 
• 如何计算和解释不同类型的效度系数 


信度和效度介绍 

社会福利（以及其他领域）的专家认为美国50多万寄养儿童的存在 
是个严重的问题。主要问题之一是出生家庭仍然在他们的生活中扮演重 
要角色的情况下，寄养儿童如何适应暂时的寄养家庭。 

索尼亚 • J • 莱瑟斯 （Sonya J . Leathers ) 在研究亲生父母的经常性拜访 

与寄养儿童对寄养家庭和亲生父母的忠诚度之间的关系时考察了这个问 
题。在 W 9 个青少年样本中她发现出生家庭的经常性拜访的确带来了冲 
突，她建议采取一些有助于减少这些冲突的干预措拖。 

她在研究中使用/许多不同的依 赖变虽 （如儿童症状 童表和 访问次 
数）。在其他方面，她做的正确的事就是关注测置工具的选择——测量 :1 
具已经建立并且具有可接受的信度和效度水平——这不是每一个研究者 
都进行的一步，却是本章我们关注的重点。 

如果想了解更多，请查阅莱塞斯 * S ( Leathers , S . )2003 年发表在《家 
庭关系》 ( Family Relations ) 第 52期53 ~ 63页的文章“寄养儿童的父母拜 
访、冲突的忠诚以及情绪和行为问题 （ Parental visiting t conflicting alle ¬ 
giances ,and enotional and behavioral problems among foster children ) ”。 

为什么学习測量 


这是非常好的问题。毕竟你选修的是统计学课程，而且到现在为止， 
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学习的内容都是统计学的内容。现在你所面对的问题似乎属于检验和测 
量课程。那么，这部分内容在统计学书屮有仆么作用？ 

这是你应该提出的一个很好的问题^为什么？到现在《爱上统计学》 
所覆盖的内容都与收集、分析和解释数据有关。这些内容中非常重要的部 
分就是收集数据，而且收集数据的关键部分就是确保数据就是你所认为应 
该是的数据——数据表示你想知道的内容。换句话说，如果你在研究贫困 
问题，你要确保你用于评估贫困的测敏工具都能发挥作用。或者你研究中 
年男性的侵略性，你要保证你评估侵略性的任何工具能发挥作用。 

还有更多的很好的信息……如果你想继续深造，并且想选修检验和测 
量课程，这一章的介绍会极大地促进你理解这个领域和艸化学习的那些 
课程。 

为了保证整个数据收集过程以及那些代表一定意义的数据都是有用 
的，你首先要保 ii 卜:你用于收集数据的工具能发挥作用。本章将要回答的基 
本问题是“我怎么知道我每一次使用的检验 、最表 和工具等都能发挥作 
用？”（这就是信度），以及“我怎么知道我每一次使用的检验、最表和工具 
等能够测量我想测量的内容”（这就是效度 h 


I 


Jf 5 





1 


任何研究人员都会告诉你建立检验工具的信度和效度的重要 
性，不论是对消费行为的简单观察工具或者是测量复杂的心理状 
恋如依恋的 I :具。此外，还有一个很好的原因。如果你用来收集 
数据的工具是不可信或无效的，那么任何假设检验的结果都不会 
有结论。如果你不能确定检验能够完成应该完成的工作并且能够 
保持一致性，那么你怎么知道你得到的显著性结果是由于有问题 
的检验. I :具还是在零假设为真的情况下实际上拒绝 r 零假设（第 
一类错误）？你是否想要一个“清白的”零假设检验？如果是，那么 
现在就开始关注信度和效度。 


关于测量尺度 


在我们对信度和效度进行更多的讨论之前，我们首先要讨论不同类型 
的测量尺度 （scales of measu rement ) 。什么是测 M ? 依据一定的规则给观 

察结果分配一定的数值——很简单。最后得到的就是我们待会儿要定义 
的不同的尺度，而且一个观察结果可以是我们有兴趣测超:的任何事物，如 
头发的颜色、性别、考试成绩或身高。 

测量的尺度或规则是 测撞观 察结果的特定水平。每一个水平都有特 
定的属性特征集。测量尺度以四种形式出现（或四种类型） ：定类 、定序、 
定距和定比。现在简单地介绍并举例说明四种不同类塑的测缺尺度。 
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玫魂的則称 ：走类 硎量水平 

定类测 M 水 4'. ( nominal level of measurement ) 是以观察结果的属性特 
征定义，也就是观察结果只适合一个而且唯一的一个分类或层级。例如， 
ff : 别是定类变量 （ 男性和女性）；种族（高加索人或非裔美国人）和政党背 
景（共和党、民主党或无党派人士）也是定类变敁。定类水平的变域是“名 
称 （ name ) ”（拉丁语中是 nominal ) ,而且是准确水平最低的测量。定类测 
屢水平 的各个类别相互排斥，例如，政党背景不能同时是民主党和共和党。 

我喜攻任何次4:走4測量水早 

定序测量_水平 （ ordinal level of measurement ) 的“序”表示次序，而 [1 被测 
鐘的事物按照它们的属性特征排序。最好的案例是一份工作的应征者的次 
序。如果我们知道拉斯的次序是1 ,谢尔登的次序是2,汉娜的次序是3,那 
么这就是定序安排。我们不知道就这个尺度拉斯相对于谢尔登是否比谢尔 
登相对于汉娜髙多少。我们只是知道成为次序1比成为次序2和次序3要 
好，但是不知道好多少。 

1+1 = 2:史距测量水平 

现在我 ff 〗 进入某个领域。当我们谈到定距测童水平 （interval level of 
measurement ) ，我们是指检验或评估工具是基于某种连续体，这样我们就可 
以讨论一个较高的成绩比较低的成绩高多少。例如，你的词汇测试成绩是 
10个单词正确，是 5 个单词正确的两倍。定距尺度的一个显著特征是尺度 
上的每个间距都相等。〖0个单词正确比8个单词正确多2个，而8个又比5 
个单词正确多3个。 

—个人可能一无所有吗？走比測量水平 

你可能 _ f !些迷惑。定比测量水平 （ratio level of measurement ) 的评估丁. 

具的特汕是测 M 尺度中绝对零值的存在。这意味着没有要测 M 的何特 

征。那么让人迷惑的是什么？我们测堡的观察结果是否可能是没什么可 

测量的？在一些学科中吋能存在这种情况。例如，在心理学和生物学中你 

可以有不存在属性特征的情况，如绝对零值（没有分子运动）或零 光程。 

在社会和行为科学中，这就比较让人迷惑了。即使你的拼写成绩是0或者 

答错 r iq 测试的每一个题 H ，也并不意味着你的拼写能力为0或者智力 
为0吧？ 

总之 …… 

这些测量尺度或规则表示观察结果在特定水平被测量 D 而 ii ， 我们 ㈡ | 
以这样 说：仟 何的测景结果都能够分配到四个测最尺度中的某一个。 
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•测 M 尺度有一定的层次，是从最不准确的定类尺度到最准确的定比 
尺度。 

• 测量尺度“越高' 收集的数据越准确，并且数据包含的细节和信息 
越多。例如了解一些人富裕一些人贫困可能已经足够（这是定类 
或分类的区别），但是准确地知道每一个人收人的多少 （ 定距或定 
比）会更好。一旦我们知道每一个人收人的所有信息，我们很容易 
在“穷” “富”之间进行简单的区别。 

• 最后，比较高的测量尺度包含所有在其之下的测量尺度的特性，如 
定距尺度包含定类尺度和定序尺度的特性。例如你知道熊的攻击 
平均值是. 350,你知道这比老虎（老虎的攻击平均值是. 250) 好. 
100,同样你也就知道熊比老虎好（但不知道好多少），而熊与老 
虎之间存在不同 （ 但是不知道到底怎样不同）。 

信度——再做一次直到得到正确的值 

信度 （ reliability ) 很好解释。信度就是一个测试或者你使用的其他任 
何测量丄具对事物的 测蜇可 以保持一致性。如果你在特定的处理方案之 
前进行人格测试，那么四个月之后再进行的相同测试是否可信？这是一个 
问题。这也是为什么有不同的信度类型，定义信度之后我们会对每一类型 
的信度进行更多的介绍。 

考武成绩——真本事泛是运气 

你参加这个课程的考试，得到一个成绩，可能是89分（这很好）或65 
分（需要好好学习）。这样的考试包含几个不同要素，包括观察值 （ ob - 
served score ，你实际得到的考试成绩，如89分或65分）和真实值 （ true 
score , 真实的，100%准确反映你对学习内容的真实掌握我们不能直接 

测量真实的成绩，因为这个值是个体所拥有的实际的特征或特性在理论上 
的数据反映。 

它们为什么不相同？如果考试（以及相应的观察值）是对测量内容的 
完美反映（我们是指绝对的完美），它们就会是相同的。 

但是人们不能保持长胜，错误总是在不经意间。墨菲定律（ Murphy * s 
law ) 告诉我们世界并不完美。因此，你看到的是观察值可能非常接近真实 

值，但是很少相同。而差异——就如你在这里看到的——'包含在将要介绍 
的误差中。 

現睿值=真輿值+误差值 

误差？的确是误差。例如，我们假定某个学生的统计学成绩是89分， 
但是他的真实成绩（我们永远不会真的知道，只是理论上可以假定）是80 
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分。这意味着9分的差异 （ 就是误差成绩）是由于误差造成的，或者说是个 
人考试成绩与100%真实成绩不同的原因。 

这样的误差的来源是什么？可能是考试的房间太热而让你犯困，这肯 
定对你的考试成绩有影响。或者是由于你没有按计划为考试复习。这两 
个例子都反映考试的环境或状况而不是被测量的特征，对吧？ 

我们的工作是尽可能减少误差，例如改善考试环境并且保证你能得到 
足够的睡眠。减少误差、增加信度，这样观察值才能和真实值更匹配。 

误差越小就越可信——这很简单。 


信皮的不同真型 


信度有几种不同的类型，现在主要介绍最重要也是最常用的四种类 
型。这几种类型都总结在表 16.1 中。 

表 16.1 信度的不同类型，何时使用，如何计算以及它们的意义 


信度的类型 何时使用 


如何计算 


举例说明所得结果的 
含义 


再测信度 

你想知道一个测试在不 
同时间是否可信 

平行形式信度 

你想知道一个测试的几 
种不同形式是否町信或 
者是否是等价的 

内在一致性 

你想知道一个测试的项 

信度 

R 是否评价一个而且只 
评价一个维度 

评分者信度 

你想知道对一个观察结 
果的评价是否具有一 

致性 


计筇时期1和时期2相同测 
试的两次值之间的相关系数 

计算一种形式测试的值与相 
同内容的另一种形式的测试 
(不是完全相同的测试）的 
测试值之间的相关系数 

每一个项目的得分与总得分 
之间的相关系数。 

检验不同评分者一致结论的 
百分比。 


不同时期的青少年认同 
的形成的邦佐 （ Bonzo ) 
测试是可信的。 

人格测试的两种形式是 
等价的，而且表现出平 
行形式的信度。 

SMART 创造性测试的 
所有项目评价相同 
结构。 

最佳着装足球运动员评 
价的不同评分者信度 
是 .91, 表示不同裁判的 
一 致程度很高。 


再測信皮（前測-后測信度） 

再测信度 （ test-retest reliability ) 用于检验一个测试在不同时期是否 
可信。 

例如，你想建立检验不同类型职业项目的选择偏好的测试。你在六月 
份进行了测试，接着在九月份进行了相同的测试（保持相同很重要）。那 
么你计算两次测试的得分集（记住是相同的人进行了两次测试）是否相 
关，也就是进行了信度的测试。再测信度是检验不同时间的变化或差异所 
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必需的信度。 

你必须确保你测量的内容是以可信的方式测量的，这样你得到的测试 
结果才可能与每个个体每个时间的值更接近。 

计算再测信度 o 下面给出 MVE (管理职业教育测试）在时期1和时期 
2的部分测试值。我们的 fl 标是计算皮尔逊相关系数作为这一测量工具 
的再测信度。 


测试者编号 

时期 I 得分 

时期2得分 

1 

54 

56 

2 

67 

77 

3 

67 

87 

4 

83 

89 

5 

■ 

87 

89 

6 

89 

90 

7 

84 

87 

8 

90 

92 

9 

98 

99 

10 

65 

76 


这个过程的第一步和最后一步是计算皮尔逊积矩相关系数（复习第5 
章相关内容），这个值等于 -90 


我们会简短地解释这个值。 

平行形式信皮 

平行形式信度 （parallel forms reliability ) 用于检验相同测试的不同形 
式的等价性和相似性。 

例如，你在研究记忆，部分研究内容是看一眼给定的10个单词并尽可 
能记住，然后在20秒钟记忆、10秒钟休之后背诵这些单词。因为这些 
研究的进行需要两天的时间，也涉及一些记忆技能的培训，你需要符合研 
究任务要求的另一组单词，而且很明显不能是相同的那些词。因此，你建 
立另一个词汇清单，而且希望这个词汇清单和上一个类似。在这个案例 

中，你希望不同形式的一致性很高-测试内容相同，只是形式不同。 

计算平行形式信度。下面给出来自 IRMT ( 自主记忆测试）的形式 A 
和形式 B 的部分数据。我们的目标是计算皮尔逊相关系数作为测量 I :具 
的平行形式信度。 
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测试者编号 

形式 A 得分 

形式 B 得分 

1 

4 

5 

2 

5 

6 

3 

3 

5 

4 

6 

6 

5 

7 

7 

6 

5 

6 

7 

6 

7 

8 

4 

8 

9 

3 

7 • 

10 

3 

7 


这个过程的第一^步和最后一^步是计算皮尔逊积矩相关系数 （ 复习第5 
章相关内容），这个值等于 

蠢1 

FormA • FormB 一 • ^ ^ 

\ 

我们会简短地解释这个值。 

甴在一致性信度 

♦ 

内在一'致性信度 （internal consistency reliability ) 与之前介绍的前两种 
类型非常不同。内在一'致性信度用于确定测试中的项目是否彼此—致，都 
只表示一个维度 、一 个结构或一个关注的领域。 

例如，你在进行对不同类型的医疗保健的态度测试，而且你想确保这 
一组5个项目都是对态度而不是其他的测试。你会看到（一个测试群体） 
每一个项目的得分，然后确定个体得分是否和总体得分相关。你预期在某 
个项目上得分高（例如，我喜欢我的 HMO ——美国健康保护组织 ） 的测试 
者会在其他项目上得分低（例如，我不想在医疗保健上花钱），而且这对所 
有的测试者都是一样的。 

计算3系数或克隆巴赫系数 （ Cronbach ’ s ) 。下面给岀10个测试者在 
5个态度项目测试（我爱 HMO 测试）上的部分样本数据，其中每个项目的 
得分在1 ( 非常不同意）到5 ( 非常同意）之间。 


测试者编号 

项目1 

项目2 

项目3 

项目4 

项目5 

1 

3 

5 

1 

4 

1 

2 

4 

4 

3 

5 

3 

3 

3 

4 

4 

4 

4 

4 

3 

3 

5 

2 

1 

5 

3 

4 

5 

4 

3 

6 

4 

5 

5 

3 

2 

7 

2 

5 

5 

會， 

3 

4 

8 

3 

4 

4 

2 

4 

9 

3 

5 

4 

4 

3 . 

10 

3 

3 

2 

3 

2 
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当你计算克隆巴赫系数（以 Lee Cronbach 命名），实际上就是 
计算每个测试者在每个项目上的得分和总的得分之间的相关系 
数，并与所有单个项目得分的变异性比较。计算的逻辑是每个总 
分很高的测试者在每一个项目上的得分应该也很高（如总分40的 
测试的每一•个项目的得分为5 ,5,3 ,5 ,3 ,4,4,2,4,5 ) ,而每个总分 
很低的测试者在每一个项目上的得分应该也很低 （ 如总分40的测 
试的每一个项目的得分为5,1 ,5,1,5,5,1,5,5,1,5,1 ,就是缺少一 
致性或者不是一维的）。 


下面是计算克隆巴赫系数的 公式: 


其中 



A ： 表示项目的个数 
4 表示观察值的方差 

E s - 表示每一个项目的方差的总和 

下面的数据与前面是相同的，还加上了完成上面的等式需要计算的值 
(观察值的方差，或 <，以及每个项目的方差的总和，或 Z <)。 


测试者编号 

项目1 

项目2 

项目3 

项目4 

项目5 

总分 

1 

3 

5 

1 

4 

1 

14 

2 

4 

4 

3 

5 

3 

19 

3 

3 

4 

4 

4 

4 

19 

4 

3 

3 

5 

2 

1 

毳 

14 

5 

3 

4 

5 

4 

3 

19 

6 

4 

5 

5 

3 

2 

19 

7 

2 

5 

5 

3 

4 

19 

8 

3 

4 

4 

2 

4 

17 

9 

3 

5 

4 

4 

3 

19 

10 

3 

3 

2 

3 

2 

13 







= 6. 4 

观察值方差 

0.32 

0.62 

1.96 

0.93 

1.34 

= 5 17 


将具体的数值代人这个公式，你就会得到下面这个等式， 


d 



\ (6. 40 一 5. 17 

) \ 6740 


= . 24 


你会发现3系数为 • 24,现在你已完成了内在一致性信度计算（之后对 
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V ， 如果我们告诉你还有许多其他类型的内在一致性信度，你不 

^ m 会感到惊讶吧？这对内在一致性的测量来说是事实。不仅有 a 系 

数，也有折半信度，斯皮尔曼 - 布朗 （ Spearman-Brown) , Kuder-Rich- 
ardson 20 和 21 ( KR 10 与 KR 2l ) ， 以及其他进行这类测试的系数，它 
们只是以不同的方式检验测试工具的一维性。 


使用计算机计算克隆巴赫系数 


一旦你知道如何手动计算克隆巴赫系数，你将会想使用 SPSS 来计算， 
两者的转换非常容易。我们使用本章之前给出的数据集 （ 10个测试者的5 
项目测试）。 

1. 在数据编辑栏录入数据。要确保不同的项目在不同的列。 

2. 点击 Analyze ― ►Scale — ►Reliability Analysis, 你就会看如图 16. 1 所示的 

对话框。 





r 


Reliability Ansilysis 




: 1 i mm 嵚 1 — 


• VAR 00002 

• VAR 00003 
：|> VAR 00004 
： |>VAR00005 

• VAROOOOS 





Reset 


Cancel 


Help 


M°del: I Alpha 
F" List item labels 




Statistics... 





16. 1 


信度分析对话框 


3. 双击变量将每个变量移到 items 框中。 

一 定要选择菜单左下角 Model 之下的 Alpha 0 

4. 点击 OK。SPSS 执行分析过程然后得出图 16. 2 所示的结果 



SPSS 输出结果的含义 

就如你所看到的， alpha 系数为，2387,非常接近我们手动计算的值。 
SPSS 输岀结果不能告诉你整个过程，只能得到个结果。 
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Reliability 


本本丰車傘本 

□ 



Method 1 (space saver) 



will be used for this analysis 



木幸幸本幸幸 




Reliability CorlTicienls 

N of Caaes= 10.0 N of ltems=5 

Alpha: .2387 


图 16.2 信度分析的 SPSS 输出结果 


评分者信皮 

评分者信度 （interrater reliability ) 是两个评分者对观察结果判断的一 
致程度的测量。 

例如，你的研究兴趣是银行工作人员和经常账户的顾客在交易过程中 
的相互作用类型，你在现场观察（在单面镜后观察）银行工作人员在接受 
了新的或高级的顾客关系课程之后是否会发生面对潜在顾客微笑等友善 
的行为。你的工作是记录每10秒内银行工作人员是否展示课程所教的三 

种不同的行为类型-微笑、坐着时身体前倾或者用手指出某个要点。每 

次看到三种行为中的任何一种出现，就在你的积分表上标注“/”。如果没 
有观察到任何一种，就标注为“ 一”。 

作为这个过程的一部分，而且为了保证你的记录是可信的，你需要知 
道不同的观察者记录这些行为发生的一致水平。记录的形式越类似，不同 
的评分者的一致水平和信度就越高。 

计算评分者信度。在这个案例中，真正重要的问题是在两分钟内每 
10秒钟（或者是12个10秒钟内）对顾客的友好行为是否发生。因此，我 
们要看的是在分成12个10秒钟的2分钟的时间框架内纪录的一致性。 

记录表中一个斜线 （/) 代表着行为发生 ，一 个横线（一）表示行为没有 
发生。 



时期一^ 

1 

2 

3 

4 

5 

6 

7 

8 

9 

10 

11 

12 

记录者1 

记录者2 

戴夫 

莫瑞恩 

/ 

/ 


/ 

/ 

/ 

/ 

/ 

/ 


/ 

/ 

/ 

/ 


/ 

/ 

/ : 

/ 


在12个时期内（存在12个可能的一致），戴夫与莫瑞恩一致认为有7 
个时期行为发生（时期1，3,4,5,7,8和 12) ，3个时期行为没有发生（时期 
2,6和 9) ，也就是说有10个记录一致，而剩下2个记录不一致。 

评分者信度可以使用下面的简单公式 计算： 

评分者之间的 J 十度=——二致的数量_ 
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代入具体的数值就会得到下面的 等式： 

评分者之间的信度=肖= . 833 

最后得到的评分者信度系数是 • 833 。 

多大才是大——鮮释信皮糸教 

现在我们开始讨论信度系数。你是否还记得第5章所学的对相关系 
数的解释？这与解释信度系数几乎是相同的，只有很小的差异。 

我们只需要确定两个方面，也就是： 

• 信度系数是正向的，而不是负向的 
• 信度系数一般都很大 （ 在 . 00和+ 1 . 00之间） 

例如，回顾本章这部分讨论的四种信度类型以及我们计算的信度系 
数，然后进行判断。 

如果你不翁:建 -2 •命皮，急么办 

建立某个测试的信度的道路并不平坦，而且不是出于没有好好工作的 

原因。如果测试是不可信的该怎么办？ 

下面的几个方面需要谨记在心。记住信度是代表观察值产生的误差 

的多少的一 ■个 函数。误差越小，信度就越高。 

• 在进行测试时，我确保对所有题项的设置都是标准化的。 

• 增加项目或者观察的数量，因为从你观察的总体行为中得到的样本越 
大，样本的代表性和信度 越高。 特别是对成绩的测试来说这是 事实。 

• 去掉有歧义的项目，因为一些人会做出一种反应，另外一些人会做 
出不同的反应，无论他们的知识、能力水平或个性特征如何。 

• 特别是对成绩测试 （ 如拼写考试、历史考试）来说，应当注意调整测 
试的容易程度和难度，因为任何测试太难或太容易都不能准确地反 

映一个人的成绩。 

• 减少夕卜部事件的影响，并且将答题指导标准化，因此如果特定事件在临 
近测试时发生，如狂欢节 （ Mardi gras ) 或毕业，就要推迟测试的进行。 

疋有一点 

建立具备合理的心理特征的测验工具的第一步是建立信度（我们只 
需多花费一些时间就行）。为什么，如果测试或测量工具不可信，或者没 
有一■致性，而且不能在不同的时间进行相同的测试，那么测量到什么还重 

要（这是效度问题）吗？ 

你可以容易地进行拼写入门的 KACAS ( Kids Are Cool at Spelling , 孩子 
对拼写很在行）测试，开始的三个项目可能是： 
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21 +13 =? 

41+33=? 

这肯定是信度很高的测试，但是肯定不是有效的测试。现在我们对信 
度已经有了很好的了解，接下来开始介绍效度。 

效度—— 哦！ 真相是什么 

效度 （ validity ) ，最简单地说，就是表示工具能够测量要测量的内容的 

性质。有效的测试是测量应该测量的内容。如果成绩测试是测量历史知 

识，那么就测量历史知识。如果智商测试是测量测试建立者定义的智商内 
容，那么就是测量这个。 

故度的不同类型 

就如信度有不同的类型，效度也有不同的类型，我们介绍最重要也是 
最常用的三种类型。这几种类型都总结在表 16.2 中。 

表 16.2 效度的不同类型，何时使用，如何计算以及它们的意义 


效度的类型 

何时使用 

如何计算 

举例说明对所得结果的 
含义 

内容效度 

你想知道一个特定主 
题的项目样本是否能 
够反映项目总体 

请教专家，让专家判断测试 
的项目是否反映将要测量的 
主题的项目总体 

我的统计学课程的每周测 
试可以评价每章的内容 

准则效度 

你想知道测试成绩是 
否和其他标准系统相 
关，这个标准表明被 
测试者具备某个领域 
的能力 

计算测试成绩和其他有效的 
测量之间的相关系数，并评 
价相同的一组能力 

研究显示烹调技能的 EAT 
测试与结束烹饪学习后两 
年内成为主厨相关（预测 
效度的一个案例） 

建构效度 

你想知道测试是否测 
量一些基本的心理 
结构 

计算测试成绩和反映测试设 
计的结构的理论结果之间的 
相关系数 

这是真实的——参与身体 
接触和危险性运动的男性 
的侵略性 TEST 测试的得 
分较高 


甴表故皮 

内容效度 （ content validity ) 就是测试项目能代表设计测试要测量的总 

体项目的性质。内容效度常用于成绩测试（例如从一年级的拼写测试到 
学术能力测试的任何测试）。 


建立内容效度。建立内容效度实际上非常容易。所有你需要做的就 
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的物理专家（也许是地方髙中的教师或者大学教授物理学的教授），而且 
我会说“嗨，艾伯特，你看这100个多项选择题能不能准确地反映我期望我 

的入门课的学生掌握的所有可能的主题和概念？” 

我可能告诉艾伯特具体的主题是什么，然后他或她看了具体题目之后 
就会给出这些题目是否符合我建立的标准——代表入门课程中的全部内 

容-的判断。如果答案是肯定，我就完成了设计 （ 至少就现在而言）。 

如果答案是否定，就要重新开始建立新的题目标准或者修正现存的题目。 


准则故皮 


准则效度 （criterion validity ) 是评价测试是否反映现在和未来的 一 组 
肯旨力。如果准则是发生在现在，我们就讨论同步效度 （ concurrent criterion 
validity )。 如果准则是发生在未来，我们就讨论预测效度 （predictive con ¬ 
current validity )。 对于准则效度的应用，不需要同时建立同步效度和预测 
效度，按照测试目的的需要选择适用的那个就行了。 

建立同步效度。例如你受雇于世界烹饪学院设计测量烹饪技能的工 
具。烹饪培训的部分内容与直接的知识有关（例如什么是奶油面粉糊？ 
这属于成绩测试的内容）。 

于是，你建立了你认为能够很好测量烹饪技能的测试表，现在你想建 
立同步效度水平。为完成这项工作你设计了烹饪量表 （ scale ) ，将每 
个裁判都使用的判断标准（如呈现、清洁等）以5分制的项目的形式集中 
在一起。作为标准（这是关键），你还有另一个裁判组，他们将学生的整体 
技能进行从1到10的等级排序。接着只需要计算烹饪量表得分和裁判的 
排序之间的相关系数。如果效度系数（简单相关系数）很高，你的设计很 
好，否则就需要重新开始。 

建立预测效度。例如我们知道烹饪学校十年来发展得很好，而你不仅 
仅对厨师厨艺的好坏感兴趣（这是你刚才建立的同步效度的部分），而且 
对预测效度也感兴趣。现在准则已经从现在当下的得分（裁判的给分）转 
变为未来的得分。 

现在我们的兴趣是建立一个测试，可预测一个厨师 10 年后的成功。 
要建立烹饪测试的预测效度，你要回顾并找到结束烹饪课程后 W 年仍然 
从事烹饪工作的毕业生，对他们进行测试。这里使用的标准是他们成功的 
水平，而且你使用的测量指标是 （ a ) 他们是否有自己的餐馆， （ b ) 餐馆经营 
是否超过1年（因为新餐馆经营的失败率在第1年就超过80% ) 。基本原 
理是如果餐馆经营超过一年，那么主厨的厨艺一定很好。 

要完成这项练习，就要计算值为1 ( 如果餐馆经营超过1年并且是毕 
业生所有）的烹饪得分与之前的 （10 年前）烹饪得分之间的相关系数。较 
高的相关系数表明具有预测效度，较低的相关系数表明缺乏预测效度。 
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建构故皮 

建构效度 （construct validity ) 是最有趣也是最难建立的效度，因为建构 
效度是基于测试或测量工具背后的基本的结构或概念的。 

你可能从你的初级心理学学习中了解了，结构是一群相关的变量。例 
如侵略性是一个结构（包括不恰当的碰触、暴力、缺乏成功的社会交往等 
等），智力、母婴依恋和希望等同样都是结构。而且要记住的是这些结构 
来自某种研究者假定的理论视角。例如，他或她认为有侵略倾向的男性比 
没有侵略倾向的男性更容易陷入与权威的矛盾中。 

建立建构效度。好，现在你拿着好斗性 （FIGHT tdst ) 测试（基于侵略 
性的）量表，它是由一系列依据你对侵略性结构构成的理论概括编出的项 
目构成的观察工具。你从犯罪学的文献中了解到具有侵略性的男性会比 
其他人更容易做岀某种类型的行为，例如他们更多地与人争论，他们更易 
发生肢体冲突（如推挤），犯下更多的暴力罪行，而且在人际关系方面更少 
能取得成功。好斗性量表包括的项目描述了不同的行为，其中一些行为在 
理论上和侵略性行为有关，其中一些无关。 一 旦好斗性量表完成，你就应 
该检验结果来确定好斗性量表的得分与你预测的行为类型（如卷人犯罪 
的水平或人际关系的性质等）之间是否相关，以及是否与理论上应当无关 
的行为类型 （ 如没有遭遇家庭暴力或完成高中、大学学 业等） 不相关。如 
果你预期相关的项目的相关系数很高，而且预期无关的项目的相关系数很 
低，那你所应用的好斗性量表（而且很可能是你设计的那些不是评价侵略 
性要素的项目起了作用）是有效的。恭喜你！ 

如果不能建立故皮 . 秀 P 么 念么办 

这个问题很难回答，特别是因为效度类型是如此之多。 

总之，如果你没有得到你想要的效度证明，这是由于你的测试没有测 
试你要测试的内容。如果是成绩测试，而且满意的内容效度水平是你要寻 

求的，那么你可能要重新设计测试的问题以确保这些问题与专家认为应该 
测试的问题保持一致。 

如果你关注准则效度，你可能需要重新检验测试的项目的性质，并且 
回答你期望人们的回答与你选定的准则之间有多大的相关程度的问题。 

最后，如果你寻求建构效度并且不能找到——最好要认真思考支持你 
建立测试的理论基础。或者是我们关于侵略性的定义和模型是错的，或者 
是知识还需要一些批判性的思考。 


最洽的建仪 


测量是 一 件相当酷的事-能激起人们的兴趣，而且在注重责任的时 

誦臟撤蘭雪赫^^隹■窗粗 fffip 搏敎迎您3 






















信度和效度：很亲的堂表兄弟关系 


现在我们暂时止步并回顾学习这一章的原因之一。 

这是必须要学习的内容。这章很重要，因为你需要了解你用于测量结 
果的工具的信度和效度。为什么？如果工具既不可信又无效，你的实验结 
果也就让人怀疑。 

就如本章之前提到的，你的测试可能是可信却无效的。但是，你的有 
效的测试却不可能没有信度。为什么？不论 一 个测试测试的是什么都可 
以重复进行（这就是信度），但是可能仍然没有测量应该测量的内容（这就 
是效度）。但是，如果一个测试确实测量了要测量的内容，那么这个测试 
就必然能够实现一致的测量。 



你可能在本章的其他地方已经看到关于信度和效度关系的内 
容，但是还存在一种潜在的关系，你会在之后的课程中学到，但是 
应该现在就有所了解。这个潜在的关系是效度的最大值等于信度 
系数的平方根。例如，如果机械能力倾向测试的信度系数是.87, 
效度系数不会超过 .93( 是 .87 的平方根）。用专业语言表示就是 
测试的效度受到测试的信度的局限。如果我们在确定测试能够测 
试到要测试的内容之前不必再思考测试必须能够重复测试要测试 
的内容，那可就太好了！ 

不过这个关系是如此紧密。你不可能有没有信度却有效度的 
工具，因为要测试应该测试的内容，必须首先具有测试的一致性， 
对吧？因此，信度和效度同时发挥作用。 
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由于这类强烈的、激增的兴趣，使得撰写学年论文或毕业论文的大学 
生或者撰写毕业论文或学位论文的研究生都十分倾向于给他们的论文方 
案设计工具。 

但要注意的是，听起来很好的想法可能导致的是一场灾难。建立任何 
工具的信度和效度的过程都需要几年的紧张工作。而且可能使得这个过 
程更糟糕的是单纯的或无怀疑精神的人想建立新的工具检验新的假设。 
这意味着在检验新的假设的同时，还得确保新的工具发挥作用。 
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小结 


这就是统计学课程里的测量内容。再提一次，任何统计学的应用都是围绕 
一些测量的结果进行的。就如你需要基本的统计学使得数据具有意义，你也需 
要基本的测量信息使得对行为、考试成绩、排序或评分的评价有意义。 


练习时间 

1. 去图书馆查找5篇你的专业领域的给出信度和效度数据报告的文章，并 
且讨论所用的结果测量指标。确定要建立的信度类型和效度类型，并且考虑你 
是否认为这个水平可接受。如果不能接受，如何改进？ 

2•提供建立再测信度和平行形式信度的案例。 

3. 在检验任何实验假设时，为什么用于测量结果的测试工具的可信性和有 
效性很重要？ 


练习参考答案 

1.自己来完成。 

2 .如果你对不同时间的评价的一致性感兴趣就使用再测信度，例如前后测 

试的研究或纵向研究。平行形式信度对确定相同内容测试的不同形式的相似程 
度很重要。 

3 •你需要使用既可信又有效的测试，否则，即使你得到零假设作为结论，你 
也不能确定是工具没有测量应测量的内容还是研究假设是错误的。 
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以及何时如何使用 


《爱上统计学》全书只是覆盖了整个统计学的一小部分。我们没有提 
供过多的知识，更重要的是初学时的内容应保持简单、直接。 

但是这并不意味着你阅读最近的研究文章或者在课堂讨论时你不会 
碰到其他的分析技术，这呰技术很重要，需要你有所了解 o 因此，为了让你 
所学更加全面，这里列出了其他7种统计技氺，介绍它们的应用，并给出使 
用这些技术间答问题的研究案例。 


知道方差分析 （ ANOVA ) 有多种应用的方式你可能并不感到惊讶，每 
一种形式的设计都适合“两个以上群体的平均值比较”的特定情况。其中 
之一是多元方差分析 （ MANOVA ) ，用于不止一个依赖变量的情况。也就 
是不只使用一个结果变■或依赖变量。如果依赖变量或结果变量之间相 
关（这种情况很常见——见第11章关于多元 〖检验 的专业讨论），就很难 
确定处理变#对单个结果变 M 的影响。因此，需要多元方差分析来解决这 

个问题。 

例如，印第安纳州立大学的乔纳森 • 普吕克 （Jonathan Phicker ) 研究天 

才少年处理学校压力的性别、种族和年级差异。他使用的多元方差分析分 
析是 2( 性别： 男性和女性） x 4 ( 种 族：高 加索人、非裔美国人、亚裔美国人 
和西班牙人） x 5( 年 级：从 8年级到〗2年级） MANOVA 。 分析的多元变量 
是青少年应对量表的5个子表。使用多元技术可以相互独立地估计独立 
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race，and grade difference in gifted adolescents，coping strategies ) 

重复测量的方差分析 


这是方差分析的另一种形式。重复测量的方差分析非常类似于其他 
的方差分析，你可以回顾第11章的两个或两个以上群体均值的差异 检验。 
就重复测量的方差分析来说，参与者在一个要素上要测试两次。这也是叫 
做“重复”的原因，你要对相同的因素在不同的时点重复测量过程。 

例如 ， B • 伦迪 、 T • 菲尔德 、 C . 麦克布莱德 、 T • 菲尔德与 S • 拉尔吉 
( B - Lundy , T . Field , C . Mcbride , T . Field & S . Largie ) 使用高中三年级和四 

年级的数据检验同性和异性最好朋友之间的相互影响。他们的主要分析 
之一是三个因素的方差分析:性别（男性或女性），友谊 （ 同性或异性）以及 

在高中的年级（三年级或四年级）。重复测量的要素是年级，因为测量过 
程是在相同的测量主题上重复。 

是否想了解更多？查阅 文献 ： B • 伦迪 、 T • 菲尔德 、 C • 麦克布莱德、 
T • 菲尔德与 S • 拉尔吉 （ B . Lundy , T . Field , T . Mcbride , T . Field , & S . 
Largie ) 发表在 1998 年《青少年》 （ zkfo / esce 狀 e ) 第 3 3 卷 130 期 280 〜289页 
的文章“高中三年级和四年级中同性和异性最好朋友之间的相互影响 

( Same-sex and opposite-sex best friend interaction among high school juniors 
and seniors ) 0 ” 


协方差分析 

这是我们介绍的最后一种方差分析。协方差分析 （ ANCOVA ) 是特别 
有趣的一种形式，因为它允许你将群体之间最初的差异等量。我们假定你 
赞助一个提高速度的项目，而且你想比较两组运动员在100码冲刺中能够 
跑多快。因为力量通常和速度有关，你必须做一些修正，这样力量就不能 
解释项目结束时的差异了。同时，你想了解去除力量因素之后的培训效 

果。你应该在培训项目开始之前测量培训者的力量，然后使用协方差分析 
来调整基于最初力量的最后速度。 

麦吉尔大学的米夏 埃拉. 希涅、 约翰. 林登与阿里.塔达什 （ Michae - 
la Hyine,John Lyndon & Ali Tardash ) 在关于亲密行为和承诺对婚前性行为 

的接受程度和使用避孕物品的影响的研究中使用了协方差分析。他们使 
用协方差分析以社会接受度作为依赖变量（在其中寻找群体差异）、特殊 
事件的排序作为协变量。协方差分析能够保证社会接受度的差异将会以 
排序进行修正，这就会成为受到控制的一种差异。 

若想了解更多，请 查阅： 希涅、林登与塔达什 （ Hyine , M . , Lyndon , J . ，& 

女心煙学:垂擇行卿破，吩，:! 
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Quarterly ) 第 21 期447 - 464 页的文章“承诺、亲密行为以及女性对婚前性 
行为和避孕物品的准备的认识 （ Commitment ， intimacy ， and Women’s per ¬ 
ceptions of premarital sex and comtraceptive readiness ) 0 ’’ 

多元回归 


你已经在第 14 章学习了如何利用 一 个变量的值来估计另 一 个变量的 

值。通常社会科学和行为科学的研究者都使用不止一个变量来估计另一 

个变量。我们在第5章和第 I 4 章都有所涉及，这里更多地介绍所谓的多 
元回归。 

例如，我们可以很容易假定父母读写方面的行为（如家里有很多书） 
与他们子女读书的多少和好坏有关系。那么研究父母的年龄、教育水平、 
读写活动以及与子女共同阅读这些变量对子女的早期语言能力、读书兴趣 
的影响一定十分有趣。 保拉 • 吕蒂宁、玛丽亚-莱纳.拉克索与安娜-迈 
亚•波伊凯乌斯 （ Paula Lyytinen , Marja-Leena Laakso , & Anna-Maija 

Poikkeus ) 进行了这方面的研究，并使用逐步回归分析来检验父母背景变 
量对孩子的读写能力的影响。他们发现母亲的读写活动和母亲的教育水 
平能够显著地影响子女的语言能力，而母亲的年龄和共同阅读没有显著 
影响。 . 

是否想了解更多？查阅文 献：吕 蒂宁、拉克索与波伊凯乌斯 （ Lyytinen , 
P . , Laakso , M - L . & Poikkeus , A - M . )1998 年发表在《欧洲教育心理学杂志》 
(European Journal of Psychology of Education ) 第 3 期 297 - 308 页的文章 

“父母对子女的早期语目和读书兴趣的影响 （ Parental contributions to 
child’s early language and interest in books ) 。” 

因子分析 


因子分析是基于不同项目的彼此相关程度并形成因子或聚类的技术。 
每一个因子代表几个不同的变量，而在特定的研究中对结果表示方面因子 
比单个变量更有效。在使用这项技术的过程中，目标是用更综合的名称如 
一个因子来描绘彼此相关的项目。而且用于描述变量群的因子的名称不 
能是随心所欲的-名称要反映内容和概念的彼此相关。 

例如，西安大略大学的 戴维. 沃尔夫 （David Wolfe ) 和他的同事尝试 
着去了解12岁以前发生的被虐待的经历对青少年时期的同伴关系和交往 
关系的影响程度。为了完成这项研究，研究者收集了多个变量的数据而且 
分析了所有变量之间的关系。那些似乎包含彼此相关项目的变量被认定 
为因子，如这项研究中名称为虐待/责备因子。另一个因子的名称是积极 

ss 蛾晒赞勝 ㈣ # 网 欢迎翻 
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爱上统计学 


是否想了解更多？查阅文 献：沃 尔夫、韦克勒、莱策尔-贾菲与勒费弗 
(Wolfe , D. A. , Wekerle , C. , Reitzel-Jaffe, D. ，& Lefebvre, L. )1968 年发表在 

《发展心理学》 （ ⑽ ZopmemaZ Psychopathology ) 第 期 61〜85 页的文章 

“受到虐待和没有受到虐待的年轻人中间与消极关系相关的因子 （ Fac tors 

associated with abusive relationships among maltreated and nonmaltreated 
youth ) 0 ’’ 


路径分析 

这是分析相关的另一项统计技术，但是在分析因素之间的关系时允许 
一定意义上确定相关的方向和因果关系。路径分析基本上通过变量间关 
系的理论假定来分析关系的方向，接着检验关系的方向是否得到数据的 
支持。 

例如，埃夫克里德、帕帕扎基、帕帕托尼奥斯与基奥赛格鲁 （ Efklides ， 
M . Papadaki ， G . Papantonious , & G . Kiosseoglou ) 研究个体学习数学过程中 

对难度的感知。为完成这项研究，他们进行了几项不同类型的测试（如认 
知领域的那些测试）而且发现对难度的感知主要受到认知（问题解决）因 
素而不是情感（情绪）因素的影响。路径分析最有趣的应用之一是结构方 
程技术，它是以图形展示所有考虑到的不同因素之间关系的结果。应用这 
项技术，你可以看到某个变量和某个变量之间相关以及相关的强度。接着 
你就可以判断数据与模型之间的适合程度。 

是否想了解更多？查阅文献 :埃夫 克里德、帕帕扎基、帕帕托尼奥斯与 
基奥赛格鲁 （ Efklides , Papadaki , Papantonious , & Kiosseoglou ) 1998 年发表在 

《欧洲教育心理学杂志 》 （■fiWopecm Journal of Psychology of Education ) 第 2 

期 207 〜 226 页的文章“个体困难度感知 差异： 以学校数学课为案例 （ Indi - 

vidual differences in feelings of difficulty : the case of school mathematics ) ”。 

结构方程模型 

结构方程模型 （ SEM ) 还是非常新的技术，但是自从 I 960 年代早期引 
人以来已经变得十分的流行。一些研究者觉得这项技术是回归、因子分析 
和路径分析的统称。其他的研究者相信这项技术本身代表着完全不同的 
方法，是基于变量之间关系的方法 （ 类似于之前我们描述的三项技术）。 

结构方程模型和其他高级统计技术如因子分析的主要差别是结构方 
程模型是实证的，而不是解释的。换句话说，研究者更多的使用结构方程 
模型来确定已经提出的模型是否发挥功效（也就是数据适合模型）。解释 
性技术用于发现特定的关系，很少 （ 不是没有）预先进行模型建构。 

wm ^ 會 赚鴒■翻 
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Kenneth Sher , & Phillip Wood ) 研究尔轻人的酒精饮用紊乱、成年前的变敏 
(性别、家庭酒精饮用川史、儿童期的压力、高屮班级的排序、宗教背景 、神 
经过敏症、个性外向、精神病史）和年轻人的发展任务（完成学位、全职工 
作、婚姻）之间的关系。他们使用结构方程模型技术发现成年前的变量相 
比年轻人的发展任务更为突出地导致年轻人酒精饮用紊乱。 

是否想了解更多？査阅文献：约塔姆、舍尔与伍徳 Gotham , H . J . , 
Sher , K . J . ，& Wood , P . K . ) 2003_ 年发表在《洒精研究杂志 》 （Journal of 
Studies on Aco / io /) 第 64( 1 ) 期 32 ~ 3 4 页的文章“青年期的酒精依赖和发 

Mf 王并 A 勺完成 （ Alcohol involvement and development task completion during 
young adulthood ) o ” 



小结 


即使你近期不会使用这些高级的统计过程，但是也有很多理由需要你至少 
对它们有所了解，因为你肯定会在不同的研究出版物中看到这些技术被提到，或 
者在你选修的其他课程中被提到。随着对基本的统计技术（本书到现在为止的 
所有章节）的了解，你可以确信你已经掌握了大量的基础统计学知识。 
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•介绍可用于分析、绘图以及更好地理解数据的各种类型的统计软件 


在你努力学习和使用基础统计时不需要让自己成为笨蛋，也就是不需 
要了解并深人到所有各种可用的计算机软件中。本章的目的是大概介绍 
一些更常用的统计软件，包括它们的特征以及用法。但是在进行具体描述 
之前，先给出几个建议。 






main * m —水赴杜沾 

^ ^ 个软件的- 

^ 、以及与编制 


面的左侧看到统计的 



件包 


制这 

I 并 t 解; 





件的公 i 的链 












的心 理学老 

将所有的重廣 







选择合适的统计软件 

这里给出的建议经得起时间的检验，可以确保你得到你想耍的统 1 1 * 
软件。 * 

1. 不论统计软件的价格高昂（如 SPSS ) 或相反（类似 Ecstatic ) ，在你购 
买之前一定要先试用。清单中的统计软件几乎都提供了试用软件（通常 
在它的网站给出），你可以下载，而且在一拽情况下你甚至可以请他们给 
你邮寄试用版本的软盘或者 CD 。 这些版本通常具备全面的特点而且可以 
持续使用30天，给予你足够的时间在购买之前试用。 

2- 既然我们刚才提到价格，直接从制造商购买软件可能是最昂贵的方 
式，特别是你直接购买没有要求学生或教师折扣（有时他们把这叫做教育 
折扣）。你学校的书店可能给你一个折扣，而邮购公司可能给你更好的折 
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扣（再一次要求教育折扣）。你可以在大众计算机杂志中找到这些销售商 
的免费电话。 

3 - 许麥编制统计分析软件的销售商提供两种版本。一种是商业版本， 

一种是学术版本。他们在内容上通常都一样但是价格有差异（有时非常 

大），如果你想要学术版本，要确定这个版本和商业版本完全相同，如果不 

相同，你就要问自 d 是否可以忍受这种差异。为仆么学术版本这么便宜？ 

公 H 希望，如果你是学生，等你毕业之后，你就会进人一些薪水高的公司并 
购买完全的版本。 

4 . 很难准确地知道在开始之前需要什么，但是一些软件包以模块的形 
式出现，而 a 你不需要购买全部便可得到你工作需要的统计丨拽。阅读公 
司的宣传手册，打电话咨询。 

5. 共享软件是另一个选择，而且有许多这样的共享软件。共享软件是 
分割软件的方法，这样只要你喜欢你就可以购买。听起来像荣誉系统，是 
不是？的确是。共享软件价格几乎都很合理，通常比商#版 本好； 而且，如 

果你已经付费，你可以帮助聪明的作者继续努力开发比现在的版本更好的 
软件。 

6 - 不要购买任何不提供电话技术支持的软件，或者至少要有类似电子 
邮件的联系。这很好验证，拨打技术支持电话（在你购买之前）来确定等 
待多长时间他们才接电话。如果你等待了 20分钟，这意味'着他们不能提 
供足够的技术支持来快速回答使用者的问题。或者你给他们发邮件却没 
有得到回复，那么就考虑其他软件。 

7. 几乎所有的大型统计软件包都有相同的功用——差别在于完成的 
方式。例如， SPSS 、 Minitab 与 JMP 在数据分析方面都做得很好，而且很受 
欢迎。但是很小的不同也可能是很大的差异。例如 Minitah 可以同时打开 
两个数据文件而 SPSS 却不可以。亲自验证一下。 

8. 确定你的硬件可以运行你要使用的软件。例如，大多数软件不受限 
于你要分析的个案和变 M 的数 M , 唯一的限制通常是你要用于储存数据文 
件的硬件驱动的大小。如果你的电脑运行速度很慢（不是奔腾系列），而 
且 RAM (随机存储器）小于64字节,那么你就可能要等待，在 CPU 缓慢运 
行程序时眼巴巴看着时间流逝。在下载试用版木之前要确定硬件可以运 
行你要用的软件。同样要确定你的硬件可以支持 Mac 操作系统或 Win ¬ 
dows 操作系统，并且可以实现兼容。 

具体介绍 

可以得到的统计软件比你需要的多。下面列出一些最流行、特点最显 

著的软件^记住许多软件功用相同。就如之前强调的，要尽可能在购买前 
试用。 • 




f 


1-5 


['、 




JMP (现在是第 5 版）如广告上所说是“统计发现 软件' 这个软件可 
以在 Windows 和 Mac 平台运行，而且是“将统计和图形 结合在 一起分析、 
理解和视觉化数据”的软件。在你读到这里时 Linux 版本 
JMP 的一个特点是用图形展示每一个统计分析结果，这样/ 

文本和图形展示的两类分析结果。而且这是自动完成的 
选择。 

沿要更多的信息，请査阅网站 http ： // www . jmp . com 。 

成本：商业版本是 995 美元，学术版本是450美元。名称为 JMPIN 的 
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图18,2 Minitab 的输出结果示例，其中窗口的底部显示数据，分析结果在窗口 

的上部显示 

在图 18.2 中，你可以看到 Minitab 输出结果的示例类似于相关和 llll 归 


的分析 


整洁、:有序 


需要更多的信息，请査阅网站 http : // www * minitab * com 。 

成本:99美元，但是你坷以花费26美元租用5个月，或者花费50美元 
租用1年。试用版本可以用30天。 

STATISTICA 


StatSoft 提供了用于 Windows 和 Mac 操作平台的 STATISTICA 产品的 
集合。这个强有力的软件的一些优 点是： 自我产生对话框（点击 OK , STA - 







学生版本是60美元，以从一个 〖 TP 公司- Duxberry Press 得到。 

Minitab 

这是第一批可用于个人电脑的软件之一，而且现在已经是第 1 3 版（已 
经转了一整圈） 了， 这意味着可以看到这些年为 r 回应使用者的需求而变 
化的部分。新的版本的一些显著特征 如下： 

• Project Mamager ™, 可以帮助你组织分析 

• StatGuide lw ，帮助解释结果 

• ReportPad ™ ， 是报告产生器 

•在线指导 

• 使用 One-Click Graphs 1 ”很 容易建立图形 
_具有你可能需要使用的所有的分析技术 
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TIST1CA 会告诉你要输人什 么）； 可定制的 界面； 很容易和其他软件 整合; 
STATISTIC A Visual Basic P] 以允许你变:现 10 000 多种功能，而且可以依据 

需要设置新的 功能； 有使用宏命令实现任务自动化的能力。网站的一个优 
点是提供电子版 STATISTICA 教科书，你可以完整下载（要有耐心，因为可 
能需要 30 分钟，这依赖你的网络连接速度）。 

需要更多的信息，请査阅网站 http : //www. statsoftinc. com 。 

成本 ：基础 版本是 795 美元 （ 有许多分析模块，而 R 你还能增加），学 
生版本是 70 美元 （ 只提供安装支持）。 

SPSS ： Mac,Windows , MS-DOS,OS/2,UNIX,VMS. MVS-VM/CMS 

SPSS 町能是现在使用的最流行的一流的统计软件包。 SPSS 具有覆 

盖统计分析所有方面的不同的模块，包括基本统计和髙级统计，而且可以 
在几乎所有的操作平台运行。 

1 i • 5 版的新优点之一是能够使用 SPSS Tables ™ ,可按照你的想法展示 
图表，而且也很容易输出到其他的应用方酣。图 18.3 展示的是 SPSS 应用 
简中 • 的数据建立的简申•的图形。同.样重要的特点还有强有力的报告撰 

与滞。 



、图18,3使用 SPSS 建立图表 

需要更多的信息，请查阅网站 http ：// www . spss . com 0 
成本：很贵。 Windows 完全版和 Mac 完全版（类似于 Windows 版）是 
IM 5 美元，而每一种学术版本是599美元。’ 

SYSTAT 

生物学和心理学的研究者更常用 SYSTAT , 而社会科学和行为科学的 
研究者喜欢 SPSS (虽然 SYSTAT 人员在最新发布的 10.2 版本中努力吸引 

社会和行为科学的研究者）。相对于其他软件，这个软件可以在许多操作 
平台使用，包括 DOS ' Windows 、 OS /2、 Mac 和 UNIX ,而 I L 支持非常强的命 
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图】 8.4 两样本均值比较 i 检验的 STATBTIX 输出结果 
需要逛多的信息，请查阅网站 htip :/ / www . statistix . com 。 

成本 ：商业 版本是 499 美元，学术版本是 299 美元，两个版本只能用于 
Windows 操作系统。 

EcStatic 

Someware in Vermont 的工作人员的目标是“以合理的价格提供智能化 
便捷型统计和绘图软件”。其实他们做得更多。 EsSlaUc 很能赚钱。 Es - 
Static 是可以运行的软件中最便宜的，而且可以肯定的是相对于这里描述 
的大型软件支付的费用而言，这个软件物超所值。如果你认为这个软件遗 
漏了什么，看看下面列出的该软件可以分析的 清单： 


令语目，这样就可以按照使用者的需要进行分析。初学者可以使用这个软 
件，但是它更适合于高年级学生或专业人员。 

沿要更多的信息，请査阅网站 http ： //www . systat . com 。 

成小：商业版本是〗 299 美元（只用于 Windows 操作系统），学术版本 
是799美元，教学版本是499美元 ( 以教师或研究者身份购买）。 

STATISTIX for Windows 

STAT [ STIX 第7版与这里介绍的其他软件功能一样强大，而 a 还提供 
主菜单驱动界面，使得这个软件特別容易学习和 使用； 提供免费技术 支持; 
不但如此一~你想到这个没？——还提供纸质的330页的使用手册。而 
且当你打电话寻求技术支持时，你可以和实际参与的程序设计人员谈话, 
他们知道在讨讼什么（我的问题在10秒内得到解答）。图 18. 4给出 
STATISTIX 的两样本£检验输出结果。结果全面又清晰。 



5 5 

3 3 
fr + 

Q □ 
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• 方差分析 
• 分裂点 
• 数值转换 
• 相关 


• 交互表和卡方 
• 频数分布和直方图 
• 非参数统计 
* 回归 


• 散点图 
• 汇总统计 
• 变 M 转换 
* t 检验 


下载试用版本体验一下吧！ 

需要更多的信息，请查阅网站 http ；// www * some ware in vt , com 0 
成本 ：89. 95 美元就可以下载，还可以得到 10 美元或更多的折扣 


(49. 95美元） 


告诉你的指导老师 


'遍4 •… ' 





小结 

这是第 IV 部分的最后一章，也应该是《爱上统计学》的最后部分。但是还需 
要继续往 下读。 下一章介绍全世界最好的 10 个统计信息网址，接着第 20 章介绍 
收集数据的原则0两者之中都有乐趣。 





第 V 部分 



网络逮住他了…重启！重新启动! 












































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































































在《爱上统计学》的第 1 版我们已经告诉读者，如果你还没有使用网 
络作为学习和研究活动的一部分，你就会遗漏许多歌要的资源。现在，更 
多的学生、研究者以及其他人员肯定已经从这个巨大的资源中获益，但是 
仍然有些人对使用网络犹豫不决。 

我们都已经认识到网络资源不能弥补学4或动机的缺失——这是无 

法弥补的-但是你肯定可以找到许多的信息丰富你整个的大学经验。 

而且这还不包括你在这个过程中能得到的乐趣。 

因此，你现祚是统计分析的新手，你一定会发现下面给出的网址十分 
有用，而且你也会想对统计学了解更多。一些是和以前相同的网址，一些 
完全是新的。 







圃蛋然网络上的网址比以前稳定，但是仍然在快速地 
今天还有效的 miL (同一 资源定 位符） 明天可能就无效了。这 
也是你可以在《爱上统计学》的网页找到所有的网 




你 





BOe _ ku • edu/faeulty/Salkind/stat8 一龟 whs •找 


到《爱上统计学》的网页，登求达娜，查找资源链接。 


成堆的资源 

这简直可以用矿脉形容。你可能需要的整页的不同类型的统计资源 
已经由戴维_ W • 斯托克伯格 （David W . Slockburger ) 教授创造性地分类 
整理在网页 http ；// www * psychstal . smsu . edu / dwsl 48£/ statislicsresourcesmain # 

asp 中。送个网址是统计学网址中最好的^不要忘掉。 

例如，打开 Berrie 的网页 （http : // www . iiuizen . dels * n 〜 berrie 1 ) 然后看一 ' 

些特定数据点变化对均值和标准差的影响的 QuickTime (短片，很短的电 
影)，或者查看全国范围的课程指导老师建立的不同 的主坂 ，或者拖看所 
有可以进行统计分析的不同的软件包（在撰写第18章时我就提供了软件 
清单）。 
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大量的计算器 

想脚直方图吗？随机数表呢？样本规模计算器呢？在 http ：// www . 
slal . ucla . edu / calculators / 的统计计算器网页给出每一超过15种）你可 

能需要的计算器和表格。足够帮助你通过你选修的统计学课程，甚至还缚 
缚有余。 

N ‘川，你町以点击 Random Permulalions( 随机排序）链接并且完成两个 
随机数表（如图 19. r 中所示的整数100之内的2位数以内的随机排序）， 
你可以得到你想要的随机数字。当你需要将特定数显的参与者分配到不 
同的群体中时就需要随机数表，这时这样的计算器就非常方便。 



Random Permutations 


12 U 姊界 611 10Q M 1&13 93 56 2® 3Q 9? 32 ^2 44 39^7 63 0^34 74 ?4 7 M 10 il 73 SS It 57 10 9 3S 73 的卯 SB 埯 $7 55+94 

OCk &5 n S3 77 3 40 72 7P 43 70 8 782691 1^37 9? *9 23 42 Ot t»6 9S 6A <40 ^7 41 3 & 45 33 54 ] 47 49 ^ 46 ^21 26^ 19 20 IS 

is 31 S? L? 蚪的 32 73 7S 57 >9 54 (,*67 即 B H ^83 20 30 40 £5 U $4£4 SD97 2^1 4919 36 33 S5?J2&£3 3^ ^7 6" W 3 6? 

66efl 37 +5 +T4i 5S 71 35 42 1 22 07 fl? 9^ 3t @*5 44 6 31 73 92 17 SS 2ft 14 13 SE 7 & 7 50 60 16 93 2S 94 10 4g 82 4 90 ^ 70 91 77 &1 *3 


lU.tA L^.n^rc^.t ftlLjKHueiJi'tM* 
lilt 在 3-0(1} 
Afct*n uftwt i«：i T ^； Ji i_n» 


图 19.1 产生随机数集 


谁是谁以及发生了什么 

拉： http :/ /www. Anselm, edu/homepage/jpitoccln/biostatshisl. html 丹勺 Mis- 

tor ^ of Statistics ( 统计学历史 ） 网页中有著名统计学家的肖像和生平，以及 

他们在统 il -学领域做出重要贡献的时间段。一些名字如贝努利、高尔顿、 
费希尔和斯皮尔曼 （ Bernoulli ， Galton ， Fisher ， & Spearman ) 是否引起你的好 

奇？往20世纪初网个均值之间的首次检验的发展状况 如何？ 这似乎有些 
沉闷，但是你有机会阅读关于填补了统计学空（」的人的生平以及他们的思 
想——总之，都是非常奇妙的思想和非常奇妙的人。 

都在这里 

SurfStat Australia (在 http://www, anu. edu. au/nceph/ surfsl at home/ su- 

frstat . html ) 是澳大利亚纽卡斯尔大学基础统计学课程的在线构成部分，但 
是其发展已经超过1987年最初的撰写者安妮特 ■ 多布森 （Annette Dofa - 
S < m Za i ) 提供的范围，这搜年安妮 • 扬与鲍勃 • 吉伯德等人 （Arnie Young , 
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Bob Gihbfird ) 不断上传新的内容 D 在这些内容中， SurfStat 包含完整的统计 

学讨论主题。除丫讨论主题之外,还有练习题，网上的统计学网址清单，以 
及 Java 程序集（可以与其他不同的统计程序共用的小程序）。 

超级统计 （ HyperStat ) 


这是 blip ：// www . davidmlane . com / hyperslat , index , html 的在线教程, 
包含 18 个课时，提供了设计优良、面对使用者的重要的基础主题。我们喜 
欢这个网址的真正原因是术语，这些术语使用网络文本和其他概念链接。 
例如，在图 19. 2 中你可以春到描述统计的定义和实他的术语链接，如均 

值、标准差以及箱形图 D 点击其中任何一个术语就会迅速看到链接的术 
语。你会渐人佳境。 


RVLS boine- 




• >- - ■« < . ■ 

■dcj? > Gbsitt! Y 


Caum^rbjtlarLLg-jt 
Crit^la] vaIih? 

^tnbuBgn 

cffifdcdoTi ： 

flTt . Y' . *1 

Dct>giKte|ri tfariabj| 
Duccif y^in 也 p 

Ej^gkjHo^ 

fo33&;BT1ttlTWl:g 广 ㈣ 

F dtfaibiflan 

Factor 






Factions] <ls^^ 



IVer s e" 



Ff^««PhCif ibiTi^Ltc^ 






FfcqifcnCV Tiblt 





-If 


1 

•坍 f 


mnuj 





Otitripdvt ftfH>£tic5 

S Hatton. !nfjffer.t^^ 

Om imp^rtanr n#e of tt to rwumnnct » cdl^thgn of datiS 

m 廨 t3c« wiy fw taiaTspk, ^ 

^sydicloj^it vsst mt«urs^ fbytuti to aU 2500 

■ftude 此 men. 由叫 4 fiTpli colksft Row n^ln 
fee furrjanafutd? There ire tw 。^hjic fue^wdi munental ,vtd 
graphic 遍 Ifii% d»e BLoiwncai o«« fright compute 

駐 ! mth *f dvt mraiard JtAndard 办 Tiieit sE^b^hci 
convay ribrn stcwt ihf ave；^c de^ee of ibytieft Uit 
degree io w+ttth pe«pk diff*? hi ttiyr^H Uik^ ihe 兵 fiphatM 
^>pn6jeh an； ms^'A ertrait ,i -.jeni anj Itnf ■J^^lav sn6 ^ 

Thtw ecjmam 如 aboui d 

*hyntf4 tcojis. 


■Graphical intd^df hc bttltr thifl fiufnrrvc^ ctiEih^di for 
i^enn^vig pattemi ^ eIic d^a Ktanjenc,ii ag^fOAthu 
pr 扣 a t wtd cbjcctvt: 


mfin 


Smct llu mhivint i! md ^aphcel 印 pf4H ： be：f 
^vtr r it it wisi? to mr both 


: wupfewns each 


N»^ t 3^f ： n<in Infflriftfl>j 4 | StaLlMS^ 






irpin^ twvaWftf i\f 






1； @ S 蹈 ilp # S ： ® j fjdHW ：_ • |[ i ： iHfpw 5 W 


IW* sin 

一: ■■… ――「 ：一 — ■■■■■■ 



Onlffw ^ N>,. 


^ ^ rnm^m — 


图！ 9, 2 超级统计屏幕显示范例 


数据，你想要数据 

i 

数据到处都是，只等着你去选择。这里给出的数椐很少。怎么应用这 
些数据？下载数据在你的学习中或者你想迸行的分析中使用，而且你还可 
以使用这些数据作为范例。 

• 统计索引数据库 (Statistical Reference Datasets ) : http :// www . itl . 
nist - gov / div 898/ strd / 

•美国人口调査局（这是个巨大的数据库或者说数据的金矿）： 

http : // factfinder , census , gov / servlet / DalaseMainpa ^ eServlet ? Jang = en 
* A : Y 卜 ; j;「‘[i i _ : i :厂玫掘和故事图书馆 ” （http ： // lib . stal . emu , 
edu / DASL /) 0 你可以查找故事链接 a 
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• 增长数据库 （ http ：// www . bris , ac * uk / Depts / Economics / Growth / 
datasets , htm ) 的大 M 的经济数据集。 

还可以在联邦政府得到的所有的数据库。你交税支持这些数据的提 
供，为什么不使用呢？例如 FE DST ATS ( http :// www . feds tats , gov / ) 提供美 

_联邦政府 70 多个机构收集计算的与公共利益相关的数据。联邦内部关 
于统计政策的委员会维护这个网址并为公众的使用提供获得这些机构生 
成的全面的统计资料和信息的人门。在这个网站你可以发现 CIA 提供的 
国家 概况； 公立学校的学生、教师和职工的数据（来自国家教育统计中 
心）；以及美国人 n 死亡率图谱（来自国家健康统计屮心）。数据非常的 
庞大！ 

越来越多的资源 

密歇根大学的网上统什资源 （the University of Michigan’s Statistics Re ¬ 
sources on Web ) ( http ：// www . lib . umich . edu / govdocs / stats . html ) « 成千上 

万的资源链接，包括银行业务、图书出版、老龄化，以及为患有过敏症的人 
提供的花粉数。浏览、查找你需要的准确的信息——不论是什么，你准能 
找到些有趣的信息。 

容易，但是有趣 

在 http :// mathforum * org / workshops / sum 96/ data * collections / datalibrary / 

dala . set 6. html 丨.，你会找到的数据包括1994年的全国棒球联合会的薪水 
数据，以及电视、医生或预期寿命的数据。不必感到惊讶，只需高兴地下载 
你需要的数据，好好分析。 

在斯德哥尔摩学习统计学如何 

肚界范围内的网络视频图书馆 ：统计 学是一个页面的名称，但是这个 
简短的名称让人误解，因为这个网址（来自佛罗里达州立大学的研究人员 

建立的 hlip :// www . slal . ufl - edu / vlib / statistics . html ) 包含了这一 v 主题下許 

个方面的内容，具体包括数据资源、工作启事、统计学校、系和部门（世界 
范围的大摄项 S 的描述）、统计学研究团体、机构和协会、统计服务、统计 
档案和资源、统计软件销售商和软件、统计学杂志、邮寄清单档案和相关的 
领域。这里可以获得的信息太多了。沿着这条路往下走之前你可得先停 
下来想想。 ’ 
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越来越多的资源——再一次强调 

在 http :// www ‘ maths , uq , edu . au / 〜 gka / webguide / datasets , html 网页的 

“统计学”是另一个非常容易获得充分信息和参考资料的网址。在这里你可以 
发现专业组织、机构、咨询群休、出版物和出版商、统计学书 g 清笮、软件的网 
页、邮购清单和讨论群体，甚至包括统计学家和统计学相关人员的信息。 

在线统计学教学资料 

如果你曾经教授统计学，或者指导过学生，这会是你想要浏览的 网址： 
htlp ；// noppa 5. pc . Helsinki . fi / Iinks . html 。 这个网址包括《爱 . h 统计学》的 

每个主题以及数以白'计的其他更多主题的资源。你输人名称就能查 找到： 
间归、 Demos 、 历史、 Sila ( 推论统计演示）、交互式的在线指导、统 H ■图、课程 
大纲、教学资料、杂志文章，甚至包括被测验者的信息。很了不起。这里提 

供的资料可能不适合你在这个课堂 f : 的需要，但是在广阔的网络肯定能抓 
住对你有用的信息。 

越来越多的资料 

Statistics . com ( www . slatistics . com ) 网站包含课程、软件、统计方法、 I : 

作、图书，甚至家庭作业的帮助等丰富的信息。例如，如果你想了解免费的 
网络支持的统计软件包，点击网页左侧的链接。这是来自比尔.特罗西莫 
(Bill Trochim) 博士 （ 见图 19. 3 > 的一个图，类似于《爱上统计学》第四部分 

每一章开始使用的流程表。你只要通过回答问题就会得到应该用什么统 
计技术进行分析的答案。 



图 19.3 选择要使用的合适的统计技术——只须按照一定的方式进行点击 
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收集数据的 10 个原则 



现在你知道的是如何分析数据，你还应该了解的是如何收集数据。数 
据收集过程很长也很严格，即使这个过程只是向学生、家长、病人或选举人 
等不同群体发放一页的简单问卷。数据收集过程也是你的研究项目中最 
耗时的部分。但是按照大多数研究者所做的，收集数据时期也可用于思考 
即将进行的分析以及分析中的问题。 

这里给出10个原则确保你依据数据的用途收集数据。与最初的10 
个原则不同，这些原则不应该死记硬背（这些原则肯定会发生变化），但是 
如果你遵循这些原则，就可以避免很多失误。 

原则1.在你思考研究问题之初，也要开始思考回答问题需要收集的 
数据类型。访谈？问卷调査？纸和笔？阅读你感兴趣的相关领域的期刊 
了解过去其他人如何收集数据并思考他们收集数据的问的。 

原则2 .在思考收集什么类型数据的同时，要思考从何处得到数据。 
如果是使用图书馆获彳軎历史数据或者已经收集完全的数据的评价文件，如 
人 n 调查数据（从美国人口调查局获得，或者 I ，网在线获得），你町能不会 
遇到什么问题。但是如果你想评价新出生的孩子和父母之间的相互影响 
如何？教师对加人工会的态度？刚过50岁的人是否觉得自己老了？所有 
这些问题都需要人们提供答案，找到调查的人很难。现在就开始。 

原则3.保证你用于收集数据的表格简单容易。以飞行员的数据集进 
行练习，这样你可以保证从最初的记分表到数据收集表都很容易。 

原则 4. 始终记得对数据文件进行备份，并 II 存储在不同的地方。记 
住有且 只有两类人：一类已经丢失了数据，另一类将会丢失数据。在不间 
的位置备份数据收集表。如果你的数据以电子文档录人，如电子表格，也 
确保要进行备份。 

原则 5. 不要依赖他人收集或转换数据，除非你对他们进行了培训，而 
丨1确信他们像你一样理解数据收集过程 p 让他人帮助你很好，而且在很长 
的收集数据期间对保持士气十分有帮助。衍是，除非帮助你的人无可怀疑 
地具备这样的能力，否则你很容易破坏你所有的工作和计划。 

原则匕计划详细的何时何地收集数据的 H 程表。如果你：要参观 3 
个学校而且每个学校有50个学生要分别进行10分钟的测试 ，那 就：要 2 5 
个小时进行测试。这并不意味着你可以在日程表屮为这项活动分配25小 
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时。从一个学校到另一个学校的时间呢？如果轮到测试的孩子刚好在卫 
生间而且你必须等10分钟直到他回到教室呢？你访问的这天刚好牛怀鲍 
伯是特別的客人…，等等。为任何町能做好准备，要在日程表中分配25% 
~50%的多余时间应对不可预测的事件的发生。 

原则只要存可能就为你的项0培育可能的数据来源。你已经对你 
的学科知识有了一定的了解，那么就可能知道谁和你需耍的类型的人一起 
工作或者谁可能帮助你获得这些样本。如果你是在大学社区，那么就可能 
存好几百人竞争你需耍的相同的调查样本。如果不想竞争，为彳十么不尝试 
在学校社区之外（大约30分钟的距离）的社区、社会群体、市民组织或睬 
院调査？在这些地方不需太多竞争就能够得到样本。 

原则 8. 尽力追踪遗漏了的测试或者访谈对象。把他们找 IKI 来并重新 
安排 h 程。一旦你习惯 r 跳过可能的参与者，那么就很容易将样本缩减到 
更小规模。而 M _ 你永远不能觉 察一一 遗漏的人可能是由于与你的研究相 

关的原因而遗漏的，这意味着你最后的样本从性质 h 不同与你研究开始时 
设定的样本。 

原则 9. 永远不要销毁你的原始数据，如测试手册、访谈笔记等等。其 

他的研究者可能想使用相同的数据库，或者你想要冋到原始数据获得更多 
的信息 

原则 10. 遵循前9个原则。这可不是开玩笑！ 
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这部分对 SPSS 进行充分的讲解，让你可以完成《爱上统计学》中的练习。 学习 
SPSS 不是火箭科学——需要花费一些时间，按照你的节奏安排进度，如果需要可以向 
同学或教师寻求帮助。 

你可能很熟悉 Windows 系统的其他应用软件，而且你会发现 SPSS 的许多模块的 
操作非常相似。我们可以假定你懂得拖动、点击、双击鼠标，也会操作 Windows 系统。 
如果不会，你可以査阅对你有帮助的 大董的 计箅机图书中的任何一本。要记住的是 
SPSS 11.5( 在你读到这本书时第12版可能已经发布）的设计是用于 Windows 95/98 , 
ME 以及 XP 系统，而不能用于任何更早版本的操作系统 。 SPSS 11.5 很好地利用了 
Windows 的特定框架结构和其他的特点，如快捷方式、右键点击和多任务操作。 

这部分是 SPSS 人门，并向你展示 SPSS 可以完成的任务。在这部分使用的案例， 
我们都使用附录 c 中名称为 Sample Data 的样本数据。你可以手动录入数据或者从 

Sage 的网站下载数据，网址是 http : // www . sagepub . com / salkind / slalbook / datasets 。 

启动 SPSS 

与其他的 Windows 应用软件一样, SPSS 是套装软件而且可以出现在开始菜单中。 
在安装软件时就建立了这种套装软件。按照下函的步骤启动 SPSS : 

1 一 点击 Start ( 开始），然后点击 Programs ( 程序）。 

2—点击 SPSS 选项。点击之后你就会看到如图 A 1 所示的启动窗口。要注意一 
些计算机的设置不同， SPSS 图标可能显示在桌面上。在这种情况下只要双,1,•图标就 
可以打开 SPSS 。 

SPSS 的打 开窗口 

就如图 A 1 中看到的，打开窗口中显示出一系列你可以选择的选项：运行 SPSS 自 
学指导 （running the SPSS tutorial ) 、录人数据 (entering data ) 、打开已建立的 query ( po ¬ 
sing an established query ) ，使用数据库建立向导建立新的 query ( creating a new query u - 
sing the database wizard ) ，或者打开现有的数据资源（数据文件 ）（ opening an existing 
source of data ) 0 如果你不想每次打开 SPSS 看到这个显示页而，可以在窗口的左下角 
选中 Don 1 t show this dialog in the future box 。 

根据目的我们点击 Type in data 选项，因为这可能是你打开和学习 SPSS 选择的第 
一个选项。点击之后就激活图 A 2 所示的 Data View (数据显示 ）（ 或 Data Editor 数据 
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图 A! SPSS 启动窗口 

编辑栏）窗口。对数据进行定义之后就在这个窗 U 录人你想应用 SPSS 分析的数据: 
甩然作第一次打开 SPSS 时看不到，但是还有另一个 （ 没有激活的）打开窗口。送就是 
Variabk view (变 M 显示窗口） t 也就是定义变量并设置变量参数的窗口 



图 A2 数据显示窗口 

结果观察窗口 （ Viewer ) 展示你分析得到的统计结果和图表。图 A3 所示是—个 

结果观察窗 U 例子。使用数据编辑栏建立数据集，一里数据集经过分析并建 立了图 
表，你就可以研究结果观察窗 P 的分析结果。 

如果你认为数据编辑栏在形式和功能上类似于电子表格，你是汜确的。形式上的 
确类似，因为数据编辑栏包含类似于 Excel 和 Lotus 1-2-3 的行和列 * 风体数值可以录人 
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图 A 3 结果观察窗口 

并且操作。功能上也类似，数据编辑栏非常类似电子表格。已经录人的数据可以转 
换、分类、重新整 理等。 


使用 X 具栏一菜单之下的图标集一一可以非常便利地操作 SPSS 。 如果你想知 
道工具栏每个图标的含义，将鼠标指向对应图标，你就可以看到这个工具可以做什么 
的解释。工具栏中一些按钮颜色比 较暗， 这意味着这些 .1: 具没有激活。 

状态栏在 SPSS 的低端，是另一个非常有用的显示在屏幕上的工具。你可以看到 
SPSS 正在进行的活动的在线报告。状恋栏显示 SPSS for Windows processor L % ready 就 

是告诉你 SPSS 可以执行你的命令或者录人数据。或者 Running 财 mm ' …告诉你 SPSS 
正处于名称为 Means 的过程中。 


使川 SPSS 帮助 


如果你需要帮助，这就找对了地方 P SPSS 提供帮助，只要点击鼠标就可以，而且 
在你已经打幵数据文件并且需要了解 SPSS 的特征时特别的有用。 SPSS 帮助十分容 
易理解，即使你是个 SPSS 新手，也能很好地向你提供帮助。 

你可以按功能键 n 得到 SPSS 帮助 （ 见图 A 2) 或者使用图 A 4 所示的 Help 菜单。 
Help 菜单中有8个选项，相对于 SPSS 的早期版本来说是极大的扩展，其屮6个 

选项与给你提供帮助直接相关。 




F cm hit 

B9 

ti 


• Topics 提供你可以得到的帮助的主题清单。 
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图 A 4 不同的帮助选项 

• Tutorial 提供使用 SPSS 的所有方面的简短指导。 

• Case Studies 提供如何应用 SPSS 的真实案例。 

• Statistics Coach 让你按步骤了解运行过程。 

• Syntax Guide 帮助你学习和使用 SPSS 的命令语言。 

• SPSS Home Page 链接 SPSS 的网络主页。 


使用功能键 F 1 

任何时候需要 SPSS 的任何方面的帮助，可以使用快捷、简易的方式得到。 
助时按功能键，你就会看到图 A 5 所示的 Help 对话框。 
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图 A 5 SPSS 帮助 


内容表 （The contents tab 


内容表描述所有帮助的大标题。双击任何一个大标题就会提供一个你可能需 
要咨询或求助的主题清单。 SPSS Help 中的索引表提供按字母排序的帮助主题。搜 
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索表允许你键人可能出现在帮助页面中的任何单词。接着 SPSS 搜索这个单词 ，〖⑴ 
不是仅仅提供一个主题的帮助。实际上，你在搜索所有主题中的所有的这一单同， 
M 后帮助菜单的常用项 （Favori tes ) nJ 以让你将你认为耑要返回去获得吏多帮助的 
主题区别开来。这也是储存你常用的帮助主题的-种方式，迭样你可以很快获得相 

同主题的帮助。 

SPSS 的简短旅程 

现在坐好了，享受 SPSS 提供的简单旅程。这里没有彳「:何想象。只是一些简单的 
数据描述、显著性检验以及一个或两个图表。我们尽力向你们展示的是 spss 的使用 

是多么的容易。 

打开一个数据文件 

你可以录人自己的数据建立新的 SPSS 数据 文忭， 使用现有的文件，甚至将其他应 
用软件如 Microsoft Excel 的数据转换为 SPSS 数据文件。无论你采用哪种方式，你需要 
数据。在图 A 6 中显示的是附录 C 中名称为样本数据 （Sample Data ) 的数据文件，这些 



数据也可以从网 h 下载。 












11 


图 A 6 打开的 SPSS 数据文件 
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简单分析 


为便于练习我们建立附录 C 中所见的 Sample Dala 文件。第一步是定义数据集中 
的变童，接着录人数据。现在打开新的数据编辑窗口 （ 点击 File ^ New -^ Data ) 0 


不定义变 M spss 不能工作。你可以 u : spss 为你定义变 M , 或者你自己定义，这 
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图 A 8 独立样本 t 检验的输出结果 

样就可以更好地控制变量显示或运行的方式。 SPSS 自动将第一个变量命名为 
VAR 00001 o 如果你在第】行第5列定义一个变摄， SPSS 会将这个变 M 命名为 
VAR 00005 ，而且按次序命名其他列的变通。但是你也 f > J •以自己定义变量，使用你确定 
的名称。 


自己定义变量：使用变 M 显示窗口 （ Variable View window ) 


要定义变 M , 必须首先进人 变最显 示窗口，点击 SPSS 显示窗口底部的 Variable 


View 栏就可以进入。点击之后就看到图 A 9 所示的变量显示窗口，也就可以定义 R : 何 



十—一 


口 0 幽 3 付 » SPSS f ： tfii 
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一个你认为适合的变量。 

—旦进人变董显示窗口，你可以按照下面的参数定义变量： 

Name 提供最多 8 个字节的变量名。 

Type 定义变量的类型，如 text 、 数值型、字符串、科学计数等等。 

Width 定义变量所占据的列的数字字符的字节数。 

Decimals 定义在数据显示栏 （ Data View) 中显示的小数点的 位数。 

Label 定义最多 256 个字节的变量的标签。 

Value 定义特定的数值对应的标签（如1为男性,2为女性）。 

Missing 表示如何处理缺失的数据。 

Columns 定义数据显水窗门 （ Data View window ) 中变量分配的空叫的数盘。 

Align 定义数据在每一格中如何显示 （ 左对齐、右对齐或居中）。 

Measure 定义最好的描述变 M 特征的测垦尺度（定类、定序或定 距）。 

把光标置于 Name (名 称）列的第一格.然后键人任何名称，并且按 Emei ■键，然后 
SPSS 将自动提供变量所有特征的默认值。如果是在数据显示窗口（点击窗口底部的 
按钮）键人数据， SPSS 将自动命名变 M 为 VAR 00001 、 VAR 00002、 VAR 00003 等。 

在 变量显 示窗口键人图 AIO 中所示的变 M 的名称。 


：i Set T & t-4 vt ^ r 


【 il* tit* yvmlyim !|uliU«r Jlidlt 



图 AIO 在变量显示窗口定义变量 

现在你就可以切换到 Data View (数据显示窗口 ）（ 见图 A 1 i ) ，接着录人图46所 

■ 

示的数据^不过.首先 it 我们来看一下没有录人数据的空白的 Data View b 



图 All 可以进行数据录入的已经定义了变量的数据显示窗口 


定义变 最标签 

你可以在 SPSS Data Editor 让数据以数值出现，或者以标签表示数值（如图 A 6 
所见）。 

为什么你想改变变量的标签？可能是你已经知道改变标签在总体上使得对数值 
(如1或 2) 的处理比对字符串或文字数字的变 M (如男性或女性）的处理更有意义。 

但是看文字比看数字更容易了解数据文件。考虑一下以数字表示变量水平（如 I 
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和 2) 的数据文件与以实际标签值（如男性和女性）表示的数据文件之间的差异。变量 
显示窗口的 values 选项可以让你在每一格键人变 M 值，但是你看到的是变 M 值的 
标签。 

如果在 Values 列（见图 A 12) 点击省略号按钮，你就会看到如图 A 13 所示的 Value 
对话框。 


IhtMjftd SPSS i tlilor 

^■mh— aBsgmsaiisgBgSBg——— 


決 。，: 







改变变量标签 


图 A 12 变最显示窗口的变量值列 



Vnlue Labefs 


厂 F 



A 13 


变置值标签对话框 


按照下面的步骤分配或改变变: M 标签。这里我们定义男性对应的标签值为1，女 
性的标签值为2。 

1 . 对性别变 fi 来说，点击省略号 （ 见图 A 12) 打开 Value Labels 对话框。 

2. 键入变量的一个数值，在这个案例中就是1为 male 。 

3. 键人变量值对应的标签，也就是 male 。 

4. 点击 Add 。 

5. 同样的过程定义2的标签为 female , 在完成定义标签的对话框的任务（见图 
A 14) ，点击 0 K , 新的标签就会显现。 



图 A 14完成的变量值标签对话框 
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如果从主菜单选择 View—►Variable Labels ， 你会在数据显示窗口看到标签，如图 
AI 5 所示 。 要注意的是图 A 15 中对应格实际上键入的值是2,即使格中显示的标签足 

Female 0 



A 15 显示变量标签 


打开数据文件 


—旦文件保存之后，就必须在再次使用时打开或回到这个文件。这个过程很 
简单。 


1 . 点击 File—►Open 0 你会看到 Open Data File ■对话框。 

2. 找到你想打开的数据文件，然后选中。 

3* 点击 OK 。 


快速找到并打开 SPSS 文件的方式是在 File 菜单的底部直接点击文件的名称。 


SPSS 会在 File 菜单列出最近使用的文件。 


SPSS 与打印过程 


现在介绍数据文件建立之后你要完成的最后一件事。建立了你想建立的文件，或 
者完成了某类分析或图表，你可能会为了安全的保存或者在报告或文章中引用而需要 
打印出一份纸质复件。那么，当 SPSS 文件已经打印好，而且你也想结束工作时，就是 
退出 SPSS 的时候了。 

打印过程和编辑和保存过程一样重要。如果不能打印，你就不能取得这个阶段的 
任何结果。 M 尔可以将 SPSS 的数据文件转换到其他的应用软件中，但是从 SPSS 直接获 
得打印件通常来说更省时也更为重要。 

打印 SPSS 数据文件 

不论是打印整个数据文件或者只是其中的一部分，打印过程都很简单。 

1 • 确定你想打印的数据文件在激活窗口中。 

2•点击 File — Print 。 结果就是你看到的 Print 对话框。 

3. 点击 OK ， 任何激活状态的内容都会被打印出来。 

就如你看到的，你可以选杼打印整个文件或者一个特定的部分（你已经在数据编 
辑窗口做了选择），也可以选择增加打 印的貧 件数量，也就从1到 99(99 是最大的可 
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以打印的复件数量） 

i 

打印 SPSS 数据文件的一部分 

打印数据文件的一部分的步骤和上面列出的打印整个数据文件的步骤一样，只是 
在数据编辑窗 N 你选择 f 你想打印的部分并且在 Prinl 对话框选择 r Selection 选项。 
步骤 如下： 

1- 确定选择了你想打印的数据文件 

2. 点击 File - + Prinl 。 

3. •在 Print 对话框 点违- Selection 。 

4. 点击 OK , 任何你选择的内容都会被打印出来。 

建立 SPSS 图表 

-幅图胜过千言万语，而且 SPSS 具备建立图表的模块，可以使分析结果生动地体 
现出来。在附录 A 部分，我们会逐步介绍几种不同图表的建立过程并提供不同图表 
的案例。接着我们会展示如何调整图表,包括添加图表的标题、数轴的标签，调整大 
小，调整字体和格式等等。需要注意一下， SPSS 中“图 （ graphs )” 、“表 （ charts )” 两个词 
代表的意思差不多。 

建立简单的图表 

所有图表的一个共同点是图表的建立都是基于数据的。你可能会输人数据建立 
图表,但是在这里的案例中我们使用附录 c 的数据建立每个群体中男性数 M 和女性 
数量的条形图（如图 A 7 中所示）。 

建立条形图 

建立任何图表的步骤基本上都相同。首先录人用于建立图表的数据，接着从 
Graphs 菜单中选择你想建立的图表的类型，然后定义图表呈现的形式，最后点击 OK 。 
下面是建立图 A 7 所示图表的步骤。 

1 . 录人用于建立图表的数据。 

2 . 点占 Graphs — Bar 。之后你就会看到阁 A 16所示的 Bar Charts 对话框。 

3. 点击 Simple 0 

4. 点击 Summaries for groups of cases 0 

5. 点击' Define D 之后你就会看到 1 )efine Simple Bar ； Summaries for Groups of Cases 
对话框。 

6. 点 [ t ? Cum n of cases 0 

7. 点击 gender ， 接着点击►将变量移到 Category Axis 框中^ 

8. 点击 OK , 你就会看到如图 A 17所示的条形图。 

保存图表 


图表不是输出窗口的唯一构成。图表是执行一定类型的分析所产生的结果的一 
部分。图表不是只代表自身的独立的部分，也不能就这样保存。要保存图表，你需要 
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图 A 16 条形图对话框 



图 A 17 简单的条形图 

保存结果观察窗口的所有内容。可以按照下面的步骤进行： 

1 * 点击 File 一 Save 0 

2 - 给结果观察窗 U 命名。 

3 - 点击 OK 。 输出结果就会保存在你提供的名称之下，扩展名是. 

修饰 SPSS 图表 


SpO Q 


一旦建立我们在之前所示的图表，你 " j 以通过 编辑图表来准确地反映你想表达的 
内容。颜色、形状、规模、字体等都可以改变。我们以最早在图 A 7 中所示的条形图来 
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说明 。 

编辑图表 

编辑图表的第一步就是双击图标，然后点击最大化按钮。你就会在图 A 18 中所 
示的图表编辨窗口 （ Chart Editor Window ) 看到整个图表。 



图 A 18 图表编辑窗口 


修改总标题和次级标题 

我们 的第— 个任务 是给图 A 17 中所示的图表键人总标题和次级标题 
I . 点击 Chart—^Titles ,你就会看到图 A1 9 所 7 TC 的 Titles 对话框。 



图 A 19标题对话框 

2. 在标题1部分键入 Frequency of Gender 。 

3 -按功能键 Tab 将光标移到 Subtitle 文本框。 

4* 键入 Draft Chart 。 

5. 从总标题和次级标题的 Justification 的下拉菜单中选择 Center 。 

6. 点击 0 K 。 

总标题和次级标题会在图中出现。如果你想编辑总标题或次级标题，首先要确定 
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万卷方法 


爱上统计学 


图是处于激活状志，然后选择 Chart—Tides 。 

修饰字体 

4 

现在开始编辑图中用于表示所有文本内容的字体。你可以采用两种方式来完成， 
每种方式都使用相同的对话框。 

1 •选择包含你想改变字体的图表区域。选择了文本之后就会在其周围出现实线 D 
2- 选择新的字体和大小，你可以 （a) 选择 Format—^Text ，或者 （b) 点击 Text 按钮。 

修饰坐标轴 


x 轴和 J 轴为独立变位（通常是尤轴）和依赖变 M (通常是 y 轴）提供刻度。 spss 

将 y 轴称为刻度轴轴称为分类轴。每个数轴都能够以不同的方式调整。双击数轴 
的标题就可以进行调整。 

如何调整刻度 (y) 轴？ 

按照下面的步骤 调整: K 轴： 

L 双击 y 轴的标题。之后你就会看到如图 A20 所示的 Scale Axis 对话框. 

2.从 Scale Axis 对话框选择你想修改的选项。 

我们进行了这样的修改： 

将 y 轴标题 cumulative Frequency 改为 Number :> 
y 轴的标题改为居中。 • 


Scale Asis 


d Pi.. B Hil-R F4 h-h, 

t 松 I 



iXIS 











總, 


"t: . n - I〆 1 , ■ ■■' s: 

AxispTilite JCumulative Frequency 

TitleJusWiqation: Left/bottom jd 
Ra _ 1 」 



T Sca,e- 







__ f 叫 




.. 


r^orD^ 
incremant; 10 








細刪 ntjlO 




厂 Ba 『细 girT 







遞 i.T : :: J ■ ^ : I 

广 Dipla^ derived axis |7 Displ^ iabel 

- -f 1 i f 靈勸 


禮 ■Is … 


图 A 20 刻度轴对话框 

我们还可以进行其他修改，如改变刻度的范围，改变主要刻度单位和最小刻度 
单位。 

如何调整分类（X)轴？ 

调整*轴和调整; r 轴一样容易。 

按照下面的步骤调整； 
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K 双击 X 轴的标题就打开 Category Axis 对话框。这个对话框和图 A 20 中看到的 
对话框非常类似。 

2•从 Category Axis 对话框选择你想修改的选项 D 

我们进行了这样的 修改： 

将 x 轴标题 GENDER 改为 Gender 。 

X 轴的标题改为居中。 

完成这些修改之后的图类似于图 A 21 所示，然后通过双击窗 C 1 图标或选择 File ^ 
Close 关闭图表编辑窗口。 



图 A 21 修改后的简单的条形图 


描述数据 

现在你对于如何在 SPSS 中建立数据文件已经有了一定的了解。接下来我们举例 
学习简单的分析。 

频数和交互表 

频数简单地计算特定数值出现的次数。交互表可以计算一个数值在一个或多个 
分类维度 h 出现的次数，如性別和年龄。频数和交互表一般都出现研究报告中，因为 
两者给出数据的总体描述。按照下面的步骤计算频数 D 首先你应该进人数据编辑 

窗口。 , 

I * 点击 Analyze ~ ►Descriptive Statistics — ► Frequencies 0 之后你就会看到如图 A 22 所 
示的 Frequencies 对话框。 

2. 双击想要进行频数计算的变量。在这个案例中是 Test 1与 Test 2 0 

3 + 点击 Statistics 。 你就会看到如图 A 23 所示的 Frequencies : Slatistics 对话框。 

4.在 Dispersion 部分，选择 Std * deviation 。 
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display frequency tables 
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图 A 23 频数:统计对话框 

義 

5* 在 Central Tendency 部分，选择 Mean 0 
6* 点击 Continueo 
7. 点击 OK 。 

输出结果包括 testl 和 test 2 的频数清单，以及每 - 
如图 A 24 所示。 


差） 


. 


独 i 样本/检验用于分析来自不同类型的研究的数据，包括试验 

调查数据，就像下面案例中所示的数据这样的，这个例子中我们检验 J 
读方面存在差异的假设。 
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Frequencies 


Statistics 



TEST1 

TEST2 

N Valid 

25 

25 

Missing 

0 

0 

Mean 

83.52 

64.24 

St 也 Deviation 

8.627 

2L642 


图 A 24 testl 与 test 2 的汇总统计 

如何执行独立样本 < 检验 ， 

按照下面的步骤执行独 立样本 < 检验： 

1 —击 Armlyze — ►Compare Means— ►，接着点击 hidependent-SampIe t Test 。 之后 { 尔 


就会看到如图 A 25 所示的 Independent-Sample t Tesl 对话 框。 



图 A 25 独立样本 f 检验对话框 


独立样本《检验对话框 

在对话框的左侧你会看到可用于分析的所有变 M 的淸单。现在你需要做的就是 
定义检验变量和分组变量。 

2 — 点击 testl ，然后点击 Test Variable( s) 框的►将变量移人 Test Variable( s) 框。 

3— 点击 gender , 然后点击 Grouping Variable 框的 ► 将变 M 移人 Grouping 
Variable 框。 

4— 点击 Refine Groups 0 

5— "在 Group 1 键人 1 D 

6— 在 Group 2 键入2。 

—点击 Continue 0 
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8—点击 OIC 。 

输出结果包括每个变量的均值、标准差，以及 f 检验的结果，如图 A 26 所示。 



图 A 26 简单 f 检验的输出结果 

我们对 spss 进行 r 最简单的介绍，而且如 果你不 r 解最初建立的数据的值和意 

义，那么这些技能 ff 定没有任何用处。因此不要受到他人使用类似 SPSS 的软件的技 

能影响，而是要更多地关注那些能够告诉你输出结果的含义以及如何反映你最初的问 
题的人。如果自己就能完成那就更好了。 

退出 SPSS 

退出 SPSS 点击 File —*" Exit 就行。 SPSS 会确保你有机会保存任何没有保存或已经 
编辑过了的文件，然后才退出。 

好啦，你的学习已经结束。 





m 

录 

B 


表 Bl :正态曲线下的面积 

如何使用这个表： 

1 .依据样本的原始数值和均值计算 z 值。 

2. 依据正确的2值确定正态曲线下面积的百分比或者确定均值和计算的 z 
值之间面积的百分比。 

表 B 2: 拒绝零假设需要的 < 值 

如何使用这 个表： 

1 . 计算检验统计 M f 值。 

2. 比较实际值£值和这个表中的临界值。确定你正确地计算了自由度，而且选择 
了合适的显著水平。 

3. 如果实际值大于临界值或这个表中的值，零假设（均值相等）不是观察到的任 
何差异的最有力解释。 

4. 如果实际值小于临界值或这个表中的值，零假设就是观察到的任何差异的最有 
力解释。 

表 B 3 :方差分析或者 F 检验的临界值 

如何使用这 个表： 

I .计算 F 值。 

2. 计筧分子的自由度 U - 丨 ） ，分母的自由度（《-命）。 

3. 依据分子向由度和分母自山度交错的位置确定临界值。临界值就是行和列交 
错位置的值。 

4. 如果实际值大于临界值或这个表中的值，零假设（均值彼此相等）不是观察到 

的任何差异的最有力解释。 ’ 

5 . 如果 实际值小于临界值或这个表中的值，零假设就是观察到的任何差异的最有 

力解释。 

喝’ 

表 B 4: 拒绝零假设需要的相关系数值 


如何使用这个表： 
i + 计算相关系数值。 
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2. 比较相关系数值和这个表中的临界值。 

3-如果实际值大于临界值或这个表中的值，零假设（相关系数等于 0) 不是观察到 
的任何差异的最有力解释 p * 

4 . 如果实际值小于临界值或这个表中的值,零假设就是观察到的彳「轲差异的最有 
力解释。 

表 B 5: 卡方检验的临界值 

如何使用这个表： 

I - 计算; T 2 值。 

2. 计算行的自由度 （ ~ 1 ) 和列的自由度 （c - 】 ） 。如果是—维表，就只有列的自 
由度。 

3•依据标题为 <40列的自由度和合适的显著水平所在的列确定对应的临界值。 

4. 如果实际值大于临界值或这个表中的值，零假设（频数彼此相等）不是观察到 
的任何差异的最有力解释。 

5-如果实际值小〒临界值或这个表中的值，零假设就是观察到的任何差异的最有 
力解释。 
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万卷方体 


爱上统计学 


L645 
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.676 


■ 68 
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L69 
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L 706 


1.708 
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1 . 762 


1,771 


L783 


1.796 



L 833 


L 86 


L 895 


i ■ 943 


2*015 


2 J 乂] 


2*353 


2,92 


6.314 


■ 10 


.01 

63 _ 657 
9.925 
5.841 
4.604 
4. 032 
3.708 
3,5 
3,356 
3.25 
3.17 
3. [06 
3.055 
3.013 
2*977 
2,947 
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2* 898 
2, 879 
2 , 86 ! 
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2, 788 
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2.086 
2,08 
2-074 
2.069 
2,064 
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2,043 
2.03 
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24 

25 

26 

27 

28 

29 

30 
35 
40 
45 


100 
Infinity 


.10 


1 

3.078 

2 

1.886 

3 

L638 

4 

1.533 

5 

1-476 

6 

1,44 

7 

L4I5 

8 

L397 

9 

L383 

10 

1 ■ 372 

II 

L364 

12 

1,356 

13 

1,35 

14 

1-345 

15 

1.341 

16 

L337 

17 

1 • 334 

18 

L33I 

t9 

L328 

20 

L326 

21 

L323 

22 

1.32i 

23 

L 32 

24 

1.318 

25 

1,317 

26 

1.315 

27 

i.314 

28 

1.313 

29 

1,312 

30 

L311 

35 

L306 

40 

K303 

45 

1.301 


100 L29 

Infinity 1.282 


.05 ,01 


6. 

314 

3L82I 

2.92 

6.965 

2, 

353 

4,541 

2, 

132 

3、 747 

2. 

015 

3,365 

L 

943 

3* 143 

L 

895 

2,998 

1 

• 86 

2. 897 

L 

833 

2. 822 

L 

813 

2, 764 

K 

796 

2.718 

I. 

783 

2.681 

1. 

771 

2,651 

K 

762 

2.625 

1, 

753 

2,603 

L 
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2.584 

1 

• 74 

2*567 

L 

734 

2.553 

L 

729 

2.54 

1, 

725 

2.528 

1. 

721 

2,518 

L 
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2.509 

L 
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2,5 

1_ 
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2,492 

L 
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2.485 

L 

706 

2.479 

L 

704 

2,473 

h 

70! 

2.467 

1, 

699 

2,462 

L 

698 

2,458 

i 

,69 

2,438 


684 

2.424 

1 

.68 

2,412 


1.66 2 .364 

L645 2,327 



单侧检验 


双侧检验 


表 B .2 拒绝零假设需要 的/值 


9 5 
2 2 
7 7 

V鲁 

1M. la— 
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表3方差分析或 F 检验的临界值 
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.万卷方法 


爱上统计学 


续表 


分母自由度第 I 类错误 


16 

,01 

8*53 

6.23 

5.29 


.05 

4,49 

3.63 

3.24 


.10 

3,05 

2.67 

2.46 

17 

,01 

8. 40 

6. 11 

5. !9 


,05 

4,45 

3,59 

3.20 


,10 

3,03 

2. 65 

2.44 

18 

.01 

8.29 

6.01 

5.09 


,05 

4,41 

3-56 

3」6 


.10 

3.()1 

2,62 

2+42 

19 

.01 

8. 19 

5,93 

5.01 


,05 

4,38 

3.52 

3. 13 


.10 

2.99 

2.61 

2-40 

20 

.01 

8.10 

5.85 

4,94 


,05 

4,35 

3.49 

3. 10 


24 


25 


26 


28 


29 


30 


10 

01 

05 

10 

01 

05 

10 

01 

05 

10 

01 

05 

10 

01 

05 

10 

01 

05 

10 

01 

05 

10 

01 

05 

10 

01 

05 

10 

01 

05 

!0 


2*98 
8.02 
4. 33 
2-96 

7.95 
4.30 

2.95 

7.88 
4,28 
2.94 
7.82 
4.26 
2.93 
7,77 
4.24 
2.92 
7,72 
4-23 
2*91 
7.68 
4,21 
2.90 
7,64 

4.20 

2.89 
7.60 
4* 18 
2, 89 
7.56 
4,17 
2.88 


2.59 

5,78 

3,47 

2.58 

5.72 

3.44 

2.56 
5 + 66 

3.42 
2.55 
5.61 
3,40 
2,54 

5.57 

3.39 
2.53 
5*53 
3,37 
2,52 

5.49 
3.36 
2,51 

5.45 
3,34 

2.50 

5.42 
3.33 

2.50 

5.39 
3.32 
2,49 


2.38 

4.88 

3.07 

2.37 

4,82 

3.05 

2.35 

4.77 

3,03 

2*34 

4,72 

3.01 

2.33 

4.68 

2.99 

2.32 

4-64 

2.98 

2,31 

4,60 

2,96 

2.30 

4.57 

2.95 

2.29 

4.54 

2*94 

2,28 

4,51 

2,92 

2.28 


分子自由度 

! 4 


29 4,77 

24 3*01 

46 2.33 

19 4.67 

20 2. 97 

U 2.31 

39 4.58 

16 2.93 

M 2. 29 

31 4*50 

13 2.90 

W 2,27 

U 4.43 

L0 2. 87 

58 2*25 

J8 4,37 

)7 2,84 

M 2.23 

12 4.31 

)5 2. 82 


2.22 
4.26 
2*80 
2*21 
4.22 
2.78 
2.20 
4. 18 
2.76 
2, 19 
4. (4 
2.74 
2. 18 
4 , 11 
2,73 
2, 17 
4.08 
2.72 
2. 16 
4,05 
2.70 
2. 15 
4.02 
2-69 
2. 14 


4.44 

2.85 
2+24 
4,34 
2.81 
2,22 
4.25 
2. 77 
2-20 
4. 17 

2.74 
2. 18 
4. 10 
2.71 
2」6 
4-04 

2.69 
2.14 
3 , 99 
2,66 
2, 13 
3.94 
2*64 
2 . 12 
3*90 
2. 62 
2, 10 

3.86 
2.60 
2.09 
3.82 
2. 59 
2.08 
3.79 
2*57 
2.07 

3.75 
2.56 
2,07 
3.73 
2.55 
2,06 

3.70 
2.53 
2,05 


6 


4 . 20 
2.74 
2,18 

4. 10 

2.70 
2.15 
4.02 
2-66 
2. 13 
3. 94 

2.63 

2. 11 
3-87 
2.60 
2.09 
3.81 
2,57 
2-08 
3、76 
2. 55 
2.06 

3.71 

2.53 
2,05 
3.67 
2,51 
2.04 

3.63 
2.49 
2,03 
3.59 
2.48 
2,01 
3,56 
2,46 
2+01 

3.53 
2,45 
2,00 
3*50 
2.43 
L99 
3-47 

2.42 

1,98 
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分母自由度第 | 类错误 


分了自 由度 


35 

‘01 

7.42 

5.27 

4.40 


‘05 

4. i 2 

3,27 

2.88 


,10 

2,86 

2,46 

2.25 

40 

,01 

7,32 

5 + 18 

- 4*31 


.05 

4,09 

3.23 

2. 84 


_ 10 

2.84 

2-44 

2,23 

45 

.01 

7,23 

5. 11 

4.25 


.05 

4,06 

3,21 

2.81 


.10 

2,82 

2,43 

2,21 

50 

• 01 

7, 17 

5.06 

4,20 , 


_05 

4.04 

3.18 

2.79 


,10 

2,81 

’ 2,41 

2.20 

55 

.01 

7, 12 

5.01 

4,16 


.05 

4,02 

3-17 

2,77 


• 10 

2.80 

2,40 

2A9 

60 

• 01 

7,08 

4,98 

4,13 


.05 

4.00 

3,15 

2*76 


* 10 

2.79 

2,39 

2.18 

65 

.01 

7.04 

4*95 

4 .10 


70 


80 


85 


90 


95 


100 


Infinity 


,05 
,10 
-01 
■ 05 
. 10 
• 01 
,05 
• 10 
.01 
.05 
J0 
.01 
.05 
-K) 
.01 
,05 
‘10 
,01 
,05 
.10 
.01 
*05 
,!0 
*01 
.05 
,10 


3. 99 
2.79 
7.01 

3.98 
2,78 

6.99 
3.97 
2.77 

3.96 

6.96 
2.77 
6*94 

3.95 
2.77 

6.93 

3.95 
2.76 
6,91 

3.94 
2.76 
6-90 

3.94 
2, 76 
6.64 
3,84 
2 + 71 


3,14 

2.39 

4,92 

3,13 

2.38 
4.90 
3,12 

2.38 
4.88 
3,11 
2.37 
4.86 
3,10 
2.37 
4,85 
3,10 
2.36 
4+84 
3,09 
2.36 
4,82 
3,09 
2.36 
4.6i 
3,00 
2,30 


2*75 
2. 17 
4* 08 
2.74 
2.16 
4.06 
2.73 
2.16 
4,04 
2.72 
2*15 
4,02 
2/71 
2.15 
4.02 
2.71 
2.15 
4,00 

2.70 

2. 14 
3-98 

2.70 

2.14 
3.78 
2*61 
2.08 


4 


3.91 

2.64 
2* 14 
3.91 

2- 64 
2. 11 

3- 83 
2*61 
2,09 
3.77 
2.58 
2.08 
3,72 

2.56 
2.06 
3.68 

2, 54 
2.05 

3.65 
2-53 
2.04 
3,62 

2- 51 
2*03 

3. 60 

2.50 
2.03 

3.56 
2.49 
2.02 

3- 55 
2.48 
2.01 
3,54 
2.47 
2.01 
3.52 
2.47 
2-01 

3.51 
2.46 
2.00 
3.32 
2*37 
L95 


3.59 

2,49 

2*02 

3.51 

2.45 
2.00 

3.46 
2.42 
L98 
3.41 
2,40 
1,97 

3.37 

2.38 
L96 

3.34 
2. 37 
i*95 

3.31 

2- 36 
i,94 
3.29 

2.35 
L93 
3,27 
2,34 
1,93 
3,26 
2,33 

1.92 
3,24 

2.32 

1.92 
3.23 
2.32 
L91 

3- 22 
2.31 
K91 
3.21 
2.31 
L91 
3.02 
2 - 22 
L85 


6 


3.37 

2.37 
1.95 

3.29 

2. 34 
1,93 

3.23 
2.31 
K91 

3.19 

2.29 
L90 
3.15 
2.27 
L89 
3*12 
2,26 
K88 
3 . 09 

2.24 
1.87 
3,07 
2,23 
1.86 

3. 05 
2.22 
1.86 
3.04 
2.22 
L85 
3,02 
2,21 
1,85 
3.01 
2*20 
L84 
3,00 

2.20 
L84 
2,99 
2.19 
1 • 83 
2.80 
2.10 
1.78 
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表 B .4 拒绝零假设需要的相关系数值 

单侧检验 ~ 检验 

.05 ,01 


1 

• 9877 

• 9995 

1 

,9969 

,9999 

2 

,9000 

,9800 

2 

.9500 

.9900 

3 

, 8054 

.9343 

3 

.8783 

■ 9587 

4 

■ 7293 

,8822 

4 

.8114 j 

.9172 

5 

. 6694 

,832 

5 

. 7545 

• 8745 

6 

.6215 

■ 7887 

6 

.7067 

.8343 

7 

.5822 

.7498 

7 

,6664 

, 7977 

8 

.5494 

.7155 

8 

.6319 

.7646 

9 

• 5214 

,6851 

9 

. 6021 

.7348 

10 

• 4973 

-6581 

10 

,5760 

.7079 

11 

,4762 

, 6339 

H 

. 5529 

*6835 

12 

. 4575 

.6120 

12 

,5324 

• 6614 

13 

,4409 

. 5923 

13 

,5139 

■ 64J1 

14 

. 4259 

,5742 

14 

.4973 

, 6226 

15 

,412 

■ 5577 

15 

,4821 

.6055 

16 

,4000 

, 5425 

16 

*4683 

. 5897 

17 

, 3887 

, 5285 

17 

.4555 

.5751 

18 

. 3783 

.5155 

18 

,4438 

,5614 

19 

.3687 

.5034 

19 

• 4329 

. 5487 

20 

. 3598 

• 4921 

20 

■ 4227 

. 5368 

25 

,3233 

• 4451 

25 

,3809 

. 4869 

30 

*2960 

_ 4093 

30 

.3494 

■ 4487 

35 

• 2746 

• 3810 

35 

,3246 

.4182 

40 

, 2573 

• 3578 

40 

• 3044 

.3932 

45 

,2428 

. 3384 

45 

. 2875 

.3721 

50 

.2306 

. 3218 

50 

. 2732 

• 3541 

60 

. 2108 

. 2948 

60 

,2500 

*3248 

70 

• 1954 

.2737 

70 

.2319 

• 3017 

80 

. 1829 

. 2565 • 

80 

• 

.2172 

,2830 

90 

. 1726 

.2422 

90 

. 2050 

,2673 

100 

. 1638 

. 2301 

100 

,1946 

• 2540 


,05 
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表 B.S 

卡方检验的临界值 


显著水平 

df 

■ 10 


,05 

.01 

I 

2,71 

■ 

3,84 

6.64 

2 

4.00 


5.99 

9,21 

3 

6.25 


7. 82 

11.34 

4 

7,78 


9.49 

13.28 

5 

9. 24 


1K07 

15,09 

6 

10*64 


12.59 

16.81 

7 

12.02 


14,07 

18,48 

8 

13.36 


15*51 

20.09 

9 

14.68 


16,92 

21.67 

10 

16.99 


18.31 

23.21 

11 

17-28 


19.68 

24.72 

12 

18,65 


21.03 

26,22 

13 

19.81 


22*36 

27,69 

14 

21.06 


23,68 

29. 14 

15 

22,31 


25.00 

30*58 

16 

23.54 


26,30 

32.00 

17 

24-77 


27.60 

33,41 

18 

25,99 


28.87 

34. 80 

19 

27.20 


30* 14 

36, 19 

20 

28,41 


3K41 

37,57 

21 

29,62 


32.67 

38,93 

22 

30*81 


33.92 

40.29 

23 

32*01 


35-17 

41.64 

24 

33, 20 


36.42 

42.98 

25 

34.38 


37 . 65 

44,81 

26 

35—56 


38.88 

45.64 

27 

36.74 


40.11 

46.96 

28 

37.92 


41.34 

48,28 

29 

39,09 


42,56 

49.59 

30 

40*26 


43/77 

50.89 




数据集 




这是《爱上统计学》中使用的数据集。这些数据可以在这里手动录人，也可以从 


卜 _这个网址下载 ： http :// www . soe . ku , edu / feculty / Salkind / stats/_fpwhs 

注意这里只包括数值（如丨和 2), 但是不包括数值的标签（如男性和女 性）。 例如 
第 9 章数据集 2 中性别由】 （ 男性）和 2 表示 （ 女性）。如果使用 SPSS, 你可以应用贴 
标签的功能给这些数值分配标签。 


就如你们从这 
个饼图中所看到的， 
我们消费的大部分, 
嗯，就是饼” 
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第 3 章数据集 1 


reac_tm 

reac_tm 

r€ac_Jm 


第 2 章数据集 1 



prej 

P 沈 j 

P re J 


87 

87 

76 

81 


99 

77 

55 

82 


87 

89 

64 

99 


87 

99 

SI 

93 


67 

96 

、 94 

94 


第 2 章数据集 2 

score 1 


score2 

$core3 



3 

34 

154 

7 

54 

167 

5 

17 

132 

4 

26 

145 

5 

34 

154 

6 

25 

145 

7 

14 

113 

8 

24 

156 

6 

25 

154 

5 

23 

123 


第 3 章数据集 2 

height 

weight 

height 

weight 

height 

weight 

height 

weight 

53 

156 

76 

171 

57 

154 

66 

156 

46 

131 

87 

143 

68 

166 

51 

173 

54 

123 

65 

'135 

65 

153 

58 

143 

44 

142 

45 

138 

66 

140 

49 

161 

56 

156 

44 

114 

54 — 

143 

48 

131 


5132571962 

a * ■ V 1 * # r i * 

0220 0 01000 


8 9 

O.O.LLO.O.O.O.0.2, 


4749873 9 2 
0.0,o. d o. CJ o. KK 



















258 


万卷方 沐 


爱上统计学 


第 4 章数据集 1 


comp_sci 

comp_5ci 

comp^sci 

12 

42 

15 ^ 

15 

44 

16 

11 

47 

22 

16 

54 

29 

21 

55 

29 

25 

51 

54 

21 

56 

56 

8 

53 


6 

57 

59 

2 

49 

54 

22 

45 

56 

26 

45 

43 

27 

47 

44 

36 

43 

41 

34 

31 

42 

33 

, 12 

7 

38 

14 



第 5 章数据集〖 


income 

educ 

income 

educ 

income 

educ 

$36 577 

11 

S44 321 

13 

$55 654 

15 

$54 365 

12 

$23 216 

9 

$76 545 

14 

$33 542 

10 

$43 454 

12 

$21 324 

11 

$65 654 

12 

$64 543 

12 

$17 645 

12 

$45 765 

11 

$43 433 

14 

$23 432 

11 

$24 354 

7 

$34 644 

12 

$44 543 

IS 

$43 233 

12 

$33 213 

10 




第 5 章数据集 2 


correct 

att 

correct 

att 

17 

94 

14 

85 

13 

73 

16 

66 

12 

59 

16 

79 

15 

80 

18 

77 

16 

93 

19 

91 
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第 9 章数据集 1 



第 9 章数据集 3 


group 


attitude 


attitude 


attitude 
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续表 




第〖 0 章数据集 2 





















附录 c 


第章数据集 I 



lang^sc 


group 


lang_sc 


group 


lang_sc 


fij 

[tj 


89 


Li] 


>1 


96 


87 


[*i 


89 


r*j 

[*1 


90 


[*： 


89 


r*i 

: *1 


96 


96 


rii 


93 


章数据集 2 


time 


prac 



[ii 

[*1 


65.9 


54. 7 


LC 


[tj 

[*] 


53.6 




58,7 


58.7 


LC 


58, 


65,7 


54 


66 


56-7 


55,4 


：ii 




r*i 


54,8 


55,8 


57,2 


第 12 章数据集 1 


Treatment 



Loss 



Gender 


Loss 


76 


76 


76 


56 


76 


76 


98 


■iHHH 


88 


78 


65 


67 
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续表 



Gender 

Loss 

Treatment 

Gender 

Loss 


mm 

65 



67 


|H 

90 



87 



65 



78 


|H 




56 






54 


EH 

79 



56 


，:雜 

70 



54 




m 


56 



Pain 


Pain 


Pain 

Severity Treatment 

Score 

Severity 

Treatment Score 

Severity 

Treatment Score 
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续表 

Pain Pain 

Score Severity Treatment Score Severity Treatment Score 




Vijk - :’ .么 





















MEI 





2.6 


•1 

*] 



:涵必 


gWjl. 




万卷方法 


爱上统计学 


training 




injuries 


train 


12 


1 


16 

16 


correct 


5 
7 

6 
2 
4 


第 


time 


14.5 

13.4 
12.7 

16.4 
21 


voucher 
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gender 


第15章数据集2 

gender 


gender 
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/ 歹卷古诔 

■■ 
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样本数据集 


gender 

group 

testl 

test2 

1 

I 

98 

32 

2 

2 

87 

33 

2 

1 

89 

54 

2 

1 

S8 

44 

1 

2 

76 

64 

I 

I 

68 

54 

2 

1 

78 

44 

2 

2 

98 

32 

2 

2 

93 

64 

1 

2 

76 

37 

2 

1 

75 

43 

2 

1 

65 

56 

I 

1 

76 

78 

2 

1 

78 

99 

2 

i 

89 

87 

2 

2 

81 

56 

I 

1 

78 

78 

2 

1 

83 

56 

I 

1 

88 

67 

2 

i . 

90 

88 

1 

I 

93 

8i 

1 

2 

89 

93 

2 

2 

86 

87 

1 

1 

77 

80 

1 

1 

89 

99 


4 



方差分析 （ Analysis of variance ) 检验两个或更多均值之间的 差异。 简单方差分析 
(ANOVA) 只有一个独立变量，而析因方差分析检验一个以 h 独立变 M ： 的均值。一兀 

方差分析检验两个以上的群体之间的均值差异。 

算术 平均值 （Arithmetic mean) 集屮 .. S 势的一种测 M 方法，也就是将数据集的所有数 
值加起来然后除以数值的个数。 ’ 

渐近性 （ Asymptotic ) 正恋曲线的性质，也就 ii !; 曲线的双尾无限接近但永选不会 1 J 
轴相交。 

平均值 （ Average) —个数据集的最有代表性的值。 

钟型曲线 （ Bell-shaped curve ) 数据的分布以中均值、中位数和众数为中心是对称，而 

且双尾具有渐近性。 

组距 （Class interval ) 用于建立频数分布的一组数据的上限和下限。 

不相关系数 （Coefficienl of alienation ) 双变置关系中不能解释的方差的大小。 

决定系数 （Coefficient of determinalion ) 双变 M 关系中可以解释的方差的大小。 

非决定系数 （Coefficient of nondetermination ) 见不相关系数。 

同步效度 (_ Concurrent validity ) J M 于检验测试结果和同期发生的标准的•致程皮 1 W 

效度类型。 

建构效度 （Construct validily ) 用于检验测试反映支持测试的结构的程度的效度 
类型。 

相关系数 （ Correlation coefficient ) 反映两个变量之间关系的数 M 指标。 

相关矩阵 （Correlation matrix ) 相关系数集。 

标准变 量 （Criterion ) 结果变 M 的另—个名称。 

准则效度 （Criterion validity ) 用于检验测试反映现在（同期)发生的准则或者未来 
(预测）发生的准则的程度的效度类型。 

临界值 （Critical value ) 把绝 （ 不*接受）零假设必需的值。 

累计频数分布 （ Cumulative hcquenoy distribution ) 以累计频数反应每个组距的频数的 

频数分布。 






268 爱上统计学 

数据 （ l > ala ) 对观察值或事件的记录，如考试成绩 v 数学课中的等级或反应时间。 

数据点 （ Data point ) —个观察值。 

数据集 （Data set ) 数据点的集合。 

■ 

自由度 （Degrees of I - eedom ) 对不间的统计检验来说是不同的值，近似于实验设计中 

每个格中的样本规模 。 

依赖变量（ Dependent variable ) 回归方程中的结果 变董或 被估计变撤， 

描述统计（ Descriptive statistics ) 描述样本或者总体特征的值 ^ 

直接相关（ Direct correlation ) 正向相关，也就是两个变量的值变化的方向相同 

有方向的研究假设 （Directional research hypolhesis ) 包含一种不相等陈述的研究 

假设。 * 

效应量 （ Effect size ) 特定结果规模的测量 Q 

预测误差 （Krror in prediction ) 实际值 （ y ) 和估计值 （ K ，） 的差异 D 
估计误差 （ Error of estimate ) 见预测误差。 

误差值 | Krrnr score ) 测试值中随机的部分，也是由于不可信的测试产生的部分 
析因方差分析 （ Factorial analysis of variance ) 一个以上因素或独立变量的方差分析。 
因子设计（ Factorial design ) 一个以上实验 （ 处理）变 M 的研究设计。 

频数分布 （ Frequency dislribution ) 说明数值在组距内分布的一个方式。 

频数多边图 （Frequency polygon ) 频数分布的图形表示。 

直方图 （Histogram ) 频数分布的图形表示。 

假设 （ Hypothesis ) 以如果-那么形式表述的变毡之间关系的推断。 

独立变最 （ Independent variable ) 回归方程中的可以控制的处理变攮或估计变量。 

间接相关( Indirect correlation ) 负相关，也就是两个变量的变化方向相反。 

推论统计< Inferential statislics ) 用样本结果推论总体的统计工具。 

交互效应 （IrUeraction effect ) 一个因素的效应受另一个因素的影响而产生的结果、 

内部一致性 信度: I rilemal consistency reliability ) 用于检验评估工具一维性质的信度 

类型。 

评分者信度 （Interrater reliability ) 用于检验评分者之间一致性的信度类型. 

定距测 H 水平 （Interval level of measurement ) 连续数据点之间距离相等的一种测量 

尺度。 

峰度 （ Kurtusis } 分布的一种特征，也就是曲线的平缓和陡峭程度。 

高狭峰 （ Uptokurtic ) 正态曲线的一种性质，也就是定义正态曲线的峰度。 

最优拟合线 （line M besl fit ) 能够最优拟合实际数值并将估计误差最小化的 ㈣ 归线 n 
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线性相关 ( Linear correlation ) 可以用直线最好地表示的相关。 

主效应 (Main effect ) 方差分析中 ，一 个因素或一个独立变 M 对结果变 M 具有显著的 

影响。 * 


均值 （Mean ) 

数量。 


平均值的一种形式，也就是将所有的观察值加起来之后除以观察值的 


平均偏差或平均差 （Mean deviation ) 所有数值偏离分布均值的偏差的平均值。 

集中趋势测 ■" ( Measures of central tendency ) 也就是均值、中位数和 众数。 

中位数 （ Median ) 数据分布中50%的个案在其之上50%个案在其之下的数据点。 
组中点 （ Midpoint ) 组距的中点。 

众数 ( Mode ) —个数据分布中出现次数最多的数值。 

多元固归 （ Multiple regression ) 用多个变量估计一个变量的统计工具。 

定类测量水平 （ Nominal level of measurement ) 只有分类没有次序和大小的测量 
尺度。 


无方向的研究假设 （ Nondireclionai research hypothesis ) 没有推断方向只断定有差异 

的假设。 • 

非参数统计 （Non parametric statistics ) 分布自由的统计。 

正态曲 _( Normal curve ) 见钟型曲线。 

零假设 （Null hypothesis ) 一组变量相等的陈述 Q 

观察值 （Observed score ) 记录或观察的值。 

实际值 （ Obtained value ) 应用统计检验得到的值。 

肩形图 （ Ogive ) 累计频数分布的图形表示^ 

单尾（侧）检验 （ One-lailed test ) 有方向的检验。 

—元方差分析 （ One-way analysis of variance ) 见方费分析。 

定序测量水平 （ Ordinal level of measurement ) 可以排序的测最尺度 D 

奇异值 （ Olliers ) 数据分布中明显的大于或小于大多数值的数值。准确地说什么是 

奇异值通常是由研究者主观决定 

平行形式信度 （Pamilel forms reliability ) 检验相同测试的不同形式的 ▲ 致性的信度 
类型。 

参数统计 （ Parametric statUiics ) 通过样本推断总体的统计。 

皮尔森积距相关系数 （ Pearson product -moment correlation) 见相关系数。 

百分位数 （Percentile point ) 数值出现于本身或其下的数据点。 

低阔峰 （PlatykunicO 定义正态曲线的平滑度的一种特性。 
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总体 （Population ) 所有可能的主体或者相关的个案。 

事后分析 （Post hoc ) 事后分析，是指通过检验确定三个或者更多群体之间差异的 
来源。 

预测效度 （ Pmdici ve validity ) 用于检验测试的结果和未来发生的标准的一致性的效 

度类型。 

估计变量（ Predictor ) 用于估计结果的变量^ 

极差 （ Range ) M 大值减去最小值，是对变异性的总的测董。不包含极差是最大值减 

去最小值。包含极差是最大值减去最小值然后加 I 。 

定比测量水平 （Ratio level of measurement ) 有绝对零值的 测量尺 度,、 

回归方程( Regression equation ) 定义最接近实际数值的点和线的方程。 

回归线 （ Regression line ) 以回归方程的值绘制的直线。 

信度 （Reliability ) 测试的一致性。 

研究假设 （Research hypothesis ) 两个变量不相等的陈述。 

样本 （ Sample ) 总体的一个子集。 

抽样误差 （Sampling error ) 样本值和总体值之间的差异。 

测量尺度 （Scales of measurement ) 测最结果的不同形式。 

散点图 （ ScaUergram ， or scatterplol ) 配对数据点构成的图 D * 

显著水平 （ Significance level ) 研究者在零假设为真的情况下拒绝零假设承担的 
风险。 

简单方差分析 （Simple analysis of variance ) 见方差分析。 

偏态或偏度 （ Skew，or skewness ) 分布的性质，用于描述特定数值的不成比例的分布。 

y 1‘侧长丁•左侧意味着在分布的数值较高一端数值出现的次数较少，这是正向偏态分 

布。右侧短于左侧意味着在分布的数值较高一端数值出现的次数较多，这是负向偏态 
分布。 _ 

源表 （Source labie ) 方差分析中表示方差来源的清单。 

标准差 （Standard deviation ) 偏离于均值的平均值。 

标准估计误差 （ Standard error of estimate ) 估计准确性的测[这。 

标准值 （Standard score ) 见 J 值。 

统计显著性 ( Statistical significance ) 见显著水平。 

统计学 （ Slatktics ) 用于组织和解释数据的一系列的工具和技术。 

再测信度（ IVsl-retest reliability ) 检验不同时期测试一致性的信度类型。 

检验统计值 （Test statistic value ) 见实 际值。 
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真实值（」 Vue score ) 反映实际能力和行为的观察值中不可观察的部分。 

双尾（侧）检验 （ Two-taiied lest ) 无方向假设也就是差异方向不重要的假设的检验 a 

第丨类错误 （Type I error ) 零假设为真的情况下拒绝零假设的概率或可能性。 

第 II 类错误 （ T ype II error ) 零假设为假的情况下接受零假设的概率或可能性。 

无偏估计 （Unbiased estimate ) 总体参数的保守估计 Q 
效度 （Validity ) 测试能够测试要测试的内容的性质。 

变异性 （ Variability ) 数据集离散或散布的数量。 

方差 （ Variance ) 标准差的平方，是数据分布的离散性或散布的另一个 量数。 
y r ( y or prime ) Y 值的估计值。 

^ 值 U score ) 依据原始数据分布的均值和标准差来调整的原始数值。 


